SlideShare uma empresa Scribd logo
1 de 8
MuLang

   Raaă Gheorghii ă Mugurel MOC2, Ivanciu Adriana MLC2, Huua nu Irina MLC2

       gheorghita.rata@infoiasi.ro, adriana.ivanciu@infoiasi.ro, hutanu.irina@infoiasi.ro


   Abstract. Proiectul are ca tema implementarea unui instrument web care să
   realizeze statistici despre utilizarea mai multor limbi în cadrul conţinuturilor
   redactate şi a conversaţiilor realizate pe mai multe bloguri. Categoriile blogurilor
   sunt obbi nute dintr-o ontologie, salvată într-un fiii er XML. Rezultatul prelucrarii
   statistice este afiia t sub forma unui grafic pe coloane, fiecare subcategorie de
   bloguri având graficul ei.




1 Date tehnice

Site-ul este creat pe platforma .NET 2.0 (C#, ASP.NET). Este testat pe Internet
Explorer 7/8, pe sistemul de operare Windos XP/Vista. Ontologia este creată cu
ajutorul aplicaei ei Protege 4.0 Build 115. Ontologia are aproximativ 50 de categorii
i subcategorii cu diverse tematici de blogging, începand de la artt , culturăă i
muzică până la politică i t i inne naturale.




                                      Fig.1. Ontologia
2




2 Utilizarea site-ului




                                        Fig.2. Interfa a

AA cum se vede in Fig. 2, meniul cuprinde o zonă de încărcare a fiii erului XML ce
   a
con.i ne ontologia. Deà site-ul a fost conceput pentru bloguri, faptul ca ontologia
                          i
poate fi schimbată, dă posibilitatea de a realiza statistici pe orice tipuri de site-uri,
categoriile fiind citite după ce ontologia a fost încărcată.
Se apasă pe butonul Browse, se alege un fiii er local, i apoi se apass pe Upload
          ă
Ontology. După acest pas, categoriile i subcategoriile din ontologie vor fi afiia te în
obiectul de tip Drop Down, ca în figura 3.




                                       Fig.3. Meniul
MuLang      3


După ce utilizatorul alege o categorie, urmează ca adresa web a blogului respectiv să
fie completată în zona link, vizibilă in figura 2. Apoi se apasă butonul Add site.
Î n acest moment, site-ul este procesat, se verificî limba folosită i se creează un
grafic, ca în figura 4.




                              Fig.4. Vizualizarea statisticilor


Desigur că la acest pas, nu putem considera că avem o statistică, dar pe masură ce
utilizatorul adaugă un numar considerabil de adrese de bloguri, tipul acestora este
contorizat, se verifică limba folosită i se construieet e graficul aferent.
Dacă limba folosită nu este gasită în fiii erul de resurse, definit in aplicaai e, atunci
blogul va fi adăugat la categoria All, ca în figura următoare.
4




                                Fig. 5. Plasarea blogurilor

Dacă blogul a fost verificat deja, iar utilizatorul incearcă să il adauge din nou, atunci
va primi un mesaj de avertizare, ca în figura 6.




                                Fig.6. Mesaj de avertizare
MuLang      5


Dacă ă doreet e anularea datelor obbi nute la un moment dat, se apass pe butonul
       se
Reset session din Figura 2. Datele vor fi ©e rse û utilizatorul poate relua construirea
                                             t       i
statisticii, inclusiv schimbând fiei erul care conui ne ontologia.

Dacă utilizatorul nu respectă paai i necesari până la obbi nerea statisticii, este
avertizat prin mesaje corespunzătoare, ca în figura următoare:




                               Fig.7. Mesaj de avertizare




3 Date de implementare


Limbile pe care aplicaai a le verifică sunt: Engleza, Franceza, Germana, Italiana,
Româna. Verificarea se face pe baza unui set minim de cuvinte specifice limbii
respective. Sunt salvate într-un fiii er de resurse care poate fi modificat fără a afecta
modul de funcii onare al aplica
6




                                  Fig. 8. Vocabular


  Fisierul conbi nând ontologia este parcurs si citit ca un fi·i er XML. Codul este
următorul:
    XmlDocument xDoc = new XmlDocument();

                xDoc.Load(Server.MapPath(".") +
    ontologyName);

                XmlNodeList list =
    xDoc.GetElementsByTagName("owl:Class");

                    foreach (XmlNode node in list)

                    {

                         if (!node.HasChildNodes)

                         {

                               if (node.Attributes.Count > 0)

                                     categList.Add(node.Attributes[0
    ].Value);

                         }

                    }

                    foreach (XmlNode node in list)
MuLang     7


                   {

                         if (node.HasChildNodes)

                         {

                               XmlNode child = node.FirstChild;

                      if (node.Attributes.Count > 0 &&
  categList.Contains(child.Attributes[0].Value))

                               {

                          int index =
  categList.IndexOf(child.Attributes[0].Value) + 1;

                          categList.Insert(index, "____"
  + node.Attributes[0].Value);

                               }

                         }

                   }
Pentru citirea blogului se folose. e functia DownloadString() care creează un
                                  t
obiect string din sursa site-ului care mai apoi e comparat cu lista de cuvinte din
fii ierul de resurse.

  Lista mesajelor de eroare sunt urmatoarele:
     lbError.Text = "You should upload an ontotlogy";

     lbError.Text = "Link could not be opened";

     lbError.Text = "Site already exists";

     lbError.Text = "Link could not be opened";

  lbError.Text = "field sitelink is empty";

  Codul este comentat folosind standardul C# :

         /// <summary>

      /// it load the ontology file and fill the
  categories list
8


          /// </summary>

        /// <param name="sender">the object who send the
    event</param>

          /// <param name="e">event arguments</param>

        protected void lbShowOntologies_Click(object
    sender, EventArgs e)

    Pentru alte detalii, se poate folosi intrarea din meniu – Contact, unde pot fi folosite
    adresele de mail ale dezvoltatorilor site-ului:




                                        Fig. 9. Contact



    5 Concluzie
    Proiectul Mulang pune bazele unei aplica@ ii de ordin statistic care faciliteaza
    colectarea de informa ie lingvistică din ontologii si bloguri. Cu ajutorul unui
    vocabular limitat format din cele mai des întâlnite prepozir ii, conjunco ii, adverbe
      i pronume relative detectează limba utilizată i
    funcr ie de aceasta i de ontologia inserată de utilizator. Utilitatea acestei
    aplicae ii este destul vastă, facilitând scanarea si detectarea diverselor limbi
    utilizate în bloguri, cât ă i organizarea de tip statistic a acestora.

Mais conteúdo relacionado

Semelhante a MuLang

Suport 01-cls9-tic-cap05-crearea paginilor web
Suport 01-cls9-tic-cap05-crearea paginilor webSuport 01-cls9-tic-cap05-crearea paginilor web
Suport 01-cls9-tic-cap05-crearea paginilor web
George Brebenel
 
Fii linked data
Fii linked dataFii linked data
Fii linked data
teodora001
 
Fii linked data
Fii linked dataFii linked data
Fii linked data
teodora001
 
Javascript ajax tutorial
Javascript ajax tutorialJavascript ajax tutorial
Javascript ajax tutorial
Vlad Posea
 

Semelhante a MuLang (20)

CLIW 2014—2015 (8/12): JavaScript în navigatorul Web
CLIW 2014—2015 (8/12): JavaScript în navigatorul WebCLIW 2014—2015 (8/12): JavaScript în navigatorul Web
CLIW 2014—2015 (8/12): JavaScript în navigatorul Web
 
Studiu referitor la evaluarea instrumentelor de realizare de raţionamente ont...
Studiu referitor la evaluarea instrumentelor de realizare de raţionamente ont...Studiu referitor la evaluarea instrumentelor de realizare de raţionamente ont...
Studiu referitor la evaluarea instrumentelor de realizare de raţionamente ont...
 
Documentatie Your Academic Tasks
Documentatie Your Academic TasksDocumentatie Your Academic Tasks
Documentatie Your Academic Tasks
 
Suport 01-cls9-tic-cap05-crearea paginilor web
Suport 01-cls9-tic-cap05-crearea paginilor webSuport 01-cls9-tic-cap05-crearea paginilor web
Suport 01-cls9-tic-cap05-crearea paginilor web
 
Flori x
Flori xFlori x
Flori x
 
Dezvoltarea Aplicatiilor Web
Dezvoltarea Aplicatiilor WebDezvoltarea Aplicatiilor Web
Dezvoltarea Aplicatiilor Web
 
Perechea_1 ro.pdf
Perechea_1 ro.pdfPerechea_1 ro.pdf
Perechea_1 ro.pdf
 
Fii linked data
Fii linked dataFii linked data
Fii linked data
 
Fii linked data
Fii linked dataFii linked data
Fii linked data
 
Fii linked data
Fii linked dataFii linked data
Fii linked data
 
Dezvoltarea aplicaţiilor Web la nivel de client (cursul #9): JavaScript în na...
Dezvoltarea aplicaţiilor Web la nivel de client (cursul #9): JavaScript în na...Dezvoltarea aplicaţiilor Web la nivel de client (cursul #9): JavaScript în na...
Dezvoltarea aplicaţiilor Web la nivel de client (cursul #9): JavaScript în na...
 
CLIW 2015-2016 (8/13) JavaScript în navigatorul Web. De la DOM la Ajax şi mas...
CLIW 2015-2016 (8/13) JavaScript în navigatorul Web. De la DOM la Ajax şi mas...CLIW 2015-2016 (8/13) JavaScript în navigatorul Web. De la DOM la Ajax şi mas...
CLIW 2015-2016 (8/13) JavaScript în navigatorul Web. De la DOM la Ajax şi mas...
 
Capitolul 3
Capitolul 3Capitolul 3
Capitolul 3
 
Proiect dolce-maly.ro WEB
Proiect dolce-maly.ro WEBProiect dolce-maly.ro WEB
Proiect dolce-maly.ro WEB
 
O lectie de anatomie Web. Disectia unui document HTML
O lectie de anatomie Web. Disectia unui document HTMLO lectie de anatomie Web. Disectia unui document HTML
O lectie de anatomie Web. Disectia unui document HTML
 
Tema10 iliuta-stoica-ontologies-web-semantics
Tema10 iliuta-stoica-ontologies-web-semanticsTema10 iliuta-stoica-ontologies-web-semantics
Tema10 iliuta-stoica-ontologies-web-semantics
 
CLIW 2017-2018 (7/12) JavaScript în navigatorul Web. De la DOM la Ajax şi mas...
CLIW 2017-2018 (7/12) JavaScript în navigatorul Web. De la DOM la Ajax şi mas...CLIW 2017-2018 (7/12) JavaScript în navigatorul Web. De la DOM la Ajax şi mas...
CLIW 2017-2018 (7/12) JavaScript în navigatorul Web. De la DOM la Ajax şi mas...
 
Fii linked data
Fii linked dataFii linked data
Fii linked data
 
Fii linked data
Fii linked dataFii linked data
Fii linked data
 
Javascript ajax tutorial
Javascript ajax tutorialJavascript ajax tutorial
Javascript ajax tutorial
 

Último

Din-Denis-2CRP1-WWE-sem2-MP Din-Denis-2CRP1-WWE-sem2-MP
Din-Denis-2CRP1-WWE-sem2-MP Din-Denis-2CRP1-WWE-sem2-MPDin-Denis-2CRP1-WWE-sem2-MP Din-Denis-2CRP1-WWE-sem2-MP
Din-Denis-2CRP1-WWE-sem2-MP Din-Denis-2CRP1-WWE-sem2-MP
mistermr080
 
Cytotec tablets IN Muscat <+96876875161// Abortion pills OMAN Misoprostol kit...
Cytotec tablets IN Muscat <+96876875161// Abortion pills OMAN Misoprostol kit...Cytotec tablets IN Muscat <+96876875161// Abortion pills OMAN Misoprostol kit...
Cytotec tablets IN Muscat <+96876875161// Abortion pills OMAN Misoprostol kit...
sikanderhasnt
 
IN Clinic Kuwait <+918133066128) Abortion pills Kuwait Cytotec 200mcg Salmiya...
IN Clinic Kuwait <+918133066128) Abortion pills Kuwait Cytotec 200mcg Salmiya...IN Clinic Kuwait <+918133066128) Abortion pills Kuwait Cytotec 200mcg Salmiya...
IN Clinic Kuwait <+918133066128) Abortion pills Kuwait Cytotec 200mcg Salmiya...
Abortion pills in Kuwait Cytotec pills in Kuwait
 
Cytotec tablets IN Muscat <+96876875161// Abortion pills OMAN Misoprostol kit...
Cytotec tablets IN Muscat <+96876875161// Abortion pills OMAN Misoprostol kit...Cytotec tablets IN Muscat <+96876875161// Abortion pills OMAN Misoprostol kit...
Cytotec tablets IN Muscat <+96876875161// Abortion pills OMAN Misoprostol kit...
sikanderhasnt
 
Cytotec tablets IN Muscat <+918133066128// Abortion pills OMAN Misoprostol ki...
Cytotec tablets IN Muscat <+918133066128// Abortion pills OMAN Misoprostol ki...Cytotec tablets IN Muscat <+918133066128// Abortion pills OMAN Misoprostol ki...
Cytotec tablets IN Muscat <+918133066128// Abortion pills OMAN Misoprostol ki...
Abortion pills in Kuwait Cytotec pills in Kuwait
 

Último (7)

Din-Denis-2CRP1-WWE-sem2-MP Din-Denis-2CRP1-WWE-sem2-MP
Din-Denis-2CRP1-WWE-sem2-MP Din-Denis-2CRP1-WWE-sem2-MPDin-Denis-2CRP1-WWE-sem2-MP Din-Denis-2CRP1-WWE-sem2-MP
Din-Denis-2CRP1-WWE-sem2-MP Din-Denis-2CRP1-WWE-sem2-MP
 
6 tipuri de clienti dificili și cum îi abordăm corect
6 tipuri de clienti dificili și cum îi abordăm corect6 tipuri de clienti dificili și cum îi abordăm corect
6 tipuri de clienti dificili și cum îi abordăm corect
 
Cytotec tablets IN Muscat <+96876875161// Abortion pills OMAN Misoprostol kit...
Cytotec tablets IN Muscat <+96876875161// Abortion pills OMAN Misoprostol kit...Cytotec tablets IN Muscat <+96876875161// Abortion pills OMAN Misoprostol kit...
Cytotec tablets IN Muscat <+96876875161// Abortion pills OMAN Misoprostol kit...
 
IN Clinic Kuwait <+918133066128) Abortion pills Kuwait Cytotec 200mcg Salmiya...
IN Clinic Kuwait <+918133066128) Abortion pills Kuwait Cytotec 200mcg Salmiya...IN Clinic Kuwait <+918133066128) Abortion pills Kuwait Cytotec 200mcg Salmiya...
IN Clinic Kuwait <+918133066128) Abortion pills Kuwait Cytotec 200mcg Salmiya...
 
Ghid practic pentru realizarea Planului de Dezvoltare Personală
Ghid practic pentru realizarea Planului de Dezvoltare PersonalăGhid practic pentru realizarea Planului de Dezvoltare Personală
Ghid practic pentru realizarea Planului de Dezvoltare Personală
 
Cytotec tablets IN Muscat <+96876875161// Abortion pills OMAN Misoprostol kit...
Cytotec tablets IN Muscat <+96876875161// Abortion pills OMAN Misoprostol kit...Cytotec tablets IN Muscat <+96876875161// Abortion pills OMAN Misoprostol kit...
Cytotec tablets IN Muscat <+96876875161// Abortion pills OMAN Misoprostol kit...
 
Cytotec tablets IN Muscat <+918133066128// Abortion pills OMAN Misoprostol ki...
Cytotec tablets IN Muscat <+918133066128// Abortion pills OMAN Misoprostol ki...Cytotec tablets IN Muscat <+918133066128// Abortion pills OMAN Misoprostol ki...
Cytotec tablets IN Muscat <+918133066128// Abortion pills OMAN Misoprostol ki...
 

MuLang

  • 1. MuLang Raaă Gheorghii ă Mugurel MOC2, Ivanciu Adriana MLC2, Huua nu Irina MLC2 gheorghita.rata@infoiasi.ro, adriana.ivanciu@infoiasi.ro, hutanu.irina@infoiasi.ro Abstract. Proiectul are ca tema implementarea unui instrument web care să realizeze statistici despre utilizarea mai multor limbi în cadrul conţinuturilor redactate şi a conversaţiilor realizate pe mai multe bloguri. Categoriile blogurilor sunt obbi nute dintr-o ontologie, salvată într-un fiii er XML. Rezultatul prelucrarii statistice este afiia t sub forma unui grafic pe coloane, fiecare subcategorie de bloguri având graficul ei. 1 Date tehnice Site-ul este creat pe platforma .NET 2.0 (C#, ASP.NET). Este testat pe Internet Explorer 7/8, pe sistemul de operare Windos XP/Vista. Ontologia este creată cu ajutorul aplicaei ei Protege 4.0 Build 115. Ontologia are aproximativ 50 de categorii i subcategorii cu diverse tematici de blogging, începand de la artt , culturăă i muzică până la politică i t i inne naturale. Fig.1. Ontologia
  • 2. 2 2 Utilizarea site-ului Fig.2. Interfa a AA cum se vede in Fig. 2, meniul cuprinde o zonă de încărcare a fiii erului XML ce a con.i ne ontologia. Deà site-ul a fost conceput pentru bloguri, faptul ca ontologia i poate fi schimbată, dă posibilitatea de a realiza statistici pe orice tipuri de site-uri, categoriile fiind citite după ce ontologia a fost încărcată. Se apasă pe butonul Browse, se alege un fiii er local, i apoi se apass pe Upload ă Ontology. După acest pas, categoriile i subcategoriile din ontologie vor fi afiia te în obiectul de tip Drop Down, ca în figura 3. Fig.3. Meniul
  • 3. MuLang 3 După ce utilizatorul alege o categorie, urmează ca adresa web a blogului respectiv să fie completată în zona link, vizibilă in figura 2. Apoi se apasă butonul Add site. Î n acest moment, site-ul este procesat, se verificî limba folosită i se creează un grafic, ca în figura 4. Fig.4. Vizualizarea statisticilor Desigur că la acest pas, nu putem considera că avem o statistică, dar pe masură ce utilizatorul adaugă un numar considerabil de adrese de bloguri, tipul acestora este contorizat, se verifică limba folosită i se construieet e graficul aferent. Dacă limba folosită nu este gasită în fiii erul de resurse, definit in aplicaai e, atunci blogul va fi adăugat la categoria All, ca în figura următoare.
  • 4. 4 Fig. 5. Plasarea blogurilor Dacă blogul a fost verificat deja, iar utilizatorul incearcă să il adauge din nou, atunci va primi un mesaj de avertizare, ca în figura 6. Fig.6. Mesaj de avertizare
  • 5. MuLang 5 Dacă ă doreet e anularea datelor obbi nute la un moment dat, se apass pe butonul se Reset session din Figura 2. Datele vor fi ©e rse û utilizatorul poate relua construirea t i statisticii, inclusiv schimbând fiei erul care conui ne ontologia. Dacă utilizatorul nu respectă paai i necesari până la obbi nerea statisticii, este avertizat prin mesaje corespunzătoare, ca în figura următoare: Fig.7. Mesaj de avertizare 3 Date de implementare Limbile pe care aplicaai a le verifică sunt: Engleza, Franceza, Germana, Italiana, Româna. Verificarea se face pe baza unui set minim de cuvinte specifice limbii respective. Sunt salvate într-un fiii er de resurse care poate fi modificat fără a afecta modul de funcii onare al aplica
  • 6. 6 Fig. 8. Vocabular Fisierul conbi nând ontologia este parcurs si citit ca un fi·i er XML. Codul este următorul: XmlDocument xDoc = new XmlDocument(); xDoc.Load(Server.MapPath(".") + ontologyName); XmlNodeList list = xDoc.GetElementsByTagName("owl:Class"); foreach (XmlNode node in list) { if (!node.HasChildNodes) { if (node.Attributes.Count > 0) categList.Add(node.Attributes[0 ].Value); } } foreach (XmlNode node in list)
  • 7. MuLang 7 { if (node.HasChildNodes) { XmlNode child = node.FirstChild; if (node.Attributes.Count > 0 && categList.Contains(child.Attributes[0].Value)) { int index = categList.IndexOf(child.Attributes[0].Value) + 1; categList.Insert(index, "____" + node.Attributes[0].Value); } } } Pentru citirea blogului se folose. e functia DownloadString() care creează un t obiect string din sursa site-ului care mai apoi e comparat cu lista de cuvinte din fii ierul de resurse. Lista mesajelor de eroare sunt urmatoarele: lbError.Text = "You should upload an ontotlogy"; lbError.Text = "Link could not be opened"; lbError.Text = "Site already exists"; lbError.Text = "Link could not be opened"; lbError.Text = "field sitelink is empty"; Codul este comentat folosind standardul C# : /// <summary> /// it load the ontology file and fill the categories list
  • 8. 8 /// </summary> /// <param name="sender">the object who send the event</param> /// <param name="e">event arguments</param> protected void lbShowOntologies_Click(object sender, EventArgs e) Pentru alte detalii, se poate folosi intrarea din meniu – Contact, unde pot fi folosite adresele de mail ale dezvoltatorilor site-ului: Fig. 9. Contact 5 Concluzie Proiectul Mulang pune bazele unei aplica@ ii de ordin statistic care faciliteaza colectarea de informa ie lingvistică din ontologii si bloguri. Cu ajutorul unui vocabular limitat format din cele mai des întâlnite prepozir ii, conjunco ii, adverbe i pronume relative detectează limba utilizată i funcr ie de aceasta i de ontologia inserată de utilizator. Utilitatea acestei aplicae ii este destul vastă, facilitând scanarea si detectarea diverselor limbi utilizate în bloguri, cât ă i organizarea de tip statistic a acestora.