SlideShare ist ein Scribd-Unternehmen logo
1 von 4
Downloaden Sie, um offline zu lesen
XML2RDF

                                                      Thomas Schöne

                                                       Universität Leipzig
                                                     Institut für Informatik




                                                         8. Mai 2012




Thomas Schöne (Universität Leipzig Institut für Informatik)   XML2RDF          8. Mai 2012   1 / 4
Aufgabe




          Übersetzung der Google Patients von XML-> RDF
          Mehrere Dateien (wenige MB bis mehrere GB)
          insgesamt etwa 1TB




Thomas Schöne (Universität Leipzig Institut für Informatik)   XML2RDF   8. Mai 2012   2 / 4
Stand




          Schritt 1: Split der Dateien in 1 Patent pro Datei (erledigt)
          Schritt 2: Parser schreiben
          Schritt 3: Dateien übersetzen




Thomas Schöne (Universität Leipzig Institut für Informatik)   XML2RDF     8. Mai 2012   3 / 4
Links




          Google Patents: http:
          //www.google.com/googlebooks/uspto-patents-grants-text.html
          RDF: http://www.w3.org/TR/REC-rdf-syntax/




Thomas Schöne (Universität Leipzig Institut für Informatik)   XML2RDF   8. Mai 2012   4 / 4

Präsentation

  • 1. XML2RDF Thomas Schöne Universität Leipzig Institut für Informatik 8. Mai 2012 Thomas Schöne (Universität Leipzig Institut für Informatik) XML2RDF 8. Mai 2012 1 / 4
  • 2. Aufgabe Übersetzung der Google Patients von XML-> RDF Mehrere Dateien (wenige MB bis mehrere GB) insgesamt etwa 1TB Thomas Schöne (Universität Leipzig Institut für Informatik) XML2RDF 8. Mai 2012 2 / 4
  • 3. Stand Schritt 1: Split der Dateien in 1 Patent pro Datei (erledigt) Schritt 2: Parser schreiben Schritt 3: Dateien übersetzen Thomas Schöne (Universität Leipzig Institut für Informatik) XML2RDF 8. Mai 2012 3 / 4
  • 4. Links Google Patents: http: //www.google.com/googlebooks/uspto-patents-grants-text.html RDF: http://www.w3.org/TR/REC-rdf-syntax/ Thomas Schöne (Universität Leipzig Institut für Informatik) XML2RDF 8. Mai 2012 4 / 4