SlideShare uma empresa Scribd logo
1 de 27
Baixar para ler offline
Semantic Web, SKOS und Linked Data


                                    Kai Eckert

            4. Leipziger Kongress für Information und Bibliothek, 16. März 2010

    Workshop in Kooperation mit dem Kompetenzzentrum Interoperable Metadaten (KIM)




Universitätsbibliothek Mannheim
Was brauchen wir?
   ●   Eine standardisierte Syntax
       ●   Damit Metadaten überhaupt als solche erkannt werden!
       ●   W3C: XML, RDF, RDF Schema, OWL
   ●   Ein oder mehrere standardisierte Vokabularien
       ●   Damit Suchmaschinen, Produzenten und Verbraucher die gleiche
           Sprache sprechen
   ●   Jede Menge Resourcen, die durch Metadaten beschrieben
       sind.




Universitätsbibliothek Mannheim
RDF: Resource Description Framework


                        map       www.fourseasons.com/de/tokyo/   type
                                                                            Hotel

                                       location


                     http://www.daml.org/2001/12
                                    /                name
                           factbook/factbook-                     “Tokyo”
                              ont#A53037




Universitätsbibliothek Mannheim
Vokabularien
   ●   Dublin Core
   ●   FRBR
   ●   FOAF
   ●   SKOS
   ●   SIOC


 Das Vokabular für die RDF-Daten.

 Beschreibung in RDF Schema und OWL

 Nicht zu verwechseln mit den bibliothekarischen
 Vokabularien: Wertevokabularien


Universitätsbibliothek Mannheim
Was sind RDF-Daten?
   ●   Tripel, die Aussagen (Statements) darstellen:
       ●   Subjekt, Prädikat, Objekt
       ●   Beispiel: Deutschland hat als Hauptstadt Berlin.
   ●   Das Subjekt und das Prädikat einer Aussage müssen innerhalb
       von RDF als URI eindeutig bezeichnet werden.
   ●   Als Objekt können URIs oder Datenwerte (Literale) verwendet
       werden.
   ●   Beispiel in RDF:
       ●   ex:locations/germany ex:vocab/capital ex:locations/berlin
       ●   ex:locations/germany ex:vocab/name „Deutschland“
       ●   ex:locations/berlin ex:vocab/name „Berlin“

Universitätsbibliothek Mannheim
Die Schönheit von URIs
   ●   Aussagen über Ressourcen können unabhängig von den
       Ressourcen selbst getätigt werden:
  http://doi.acm.org/10.1145/1298406.1298426


                                  http://purl.org/dc/elements/1.1/creator


Verschiedene Orte!
Verschiedene Besitzer!
                                                http://dblp.uni-trier.de/rec/pers/e/Eckert:Kai/



          doi:10.1145/1298406.1298426       dc:creator    dblp:pers/e/Eckert:Kai/




Universitätsbibliothek Mannheim
Die Eindeutigkeit von URIs
   ●   Eine URI beschreibt eindeutig und (hoffentlich) dauerhaft eine
       ganz bestimmte Ressource.
       ●   http://dblp.uni-trier.de/rec/pers/e/Eckert:Kai/
   ●   Aber: Eine Ressource kann durch verschiedene URIs
       beschrieben werden
       ●   http://dblp.uni-trier.de/rec/pers/e/Eckert:Kai/
       ●   http://ki.informatik.uni-mannheim.de/people/kai_eckert.html
       ●   http://de.linkedin.com/in/kaieckert
       ●   …
   ●   Keine Eineindeutigkeit!


Universitätsbibliothek Mannheim
Ist das ein Problem?
   ●   Die Äquivalenz von URIs lässt sich jederzeit und von jedem als
       RDF Statement ausdrücken:
       ●
           http://de.linkedin.com/in/kaieckert owl:sameAs    ↵
           http://dblp.uni-trier.de/rec/pers/e/Eckert:Kai/
   ●   Dadurch lassen sich insbesondere auch Prädikate (Vokabular)
       gleichsetzen.
   ●   So lassen sich transparent Datenbestände mit anderen
       Datenbeständen verknüpfen.
   ●   → Linked Data




Universitätsbibliothek Mannheim
Exkurs: URI Syntax
   ●   <schema>:<Schema-spezifischer Teil>
   ●   Beispiele
       ●   http://www.bib.uni-mannheim.de/
       ●   mailto:eckert@bib.uni-mannheim.de
       ●   http://purl.org/dc/elements/1.1/creator
       ●   http://dublincore.org/2008/01/14/dcelements.rdf#creator
       ●   info:lc/vocabulary/countries/af
       ●   urn:nbn:de:gbv:089-3321752945
       ●   urn:isbn:0345391802
       ●   http://doi.acm.org/10.1145/1298406.1298426
       ●   http://dx.doi.org/10.1145/1298406.129842


Universitätsbibliothek Mannheim
Exkurs: Verschiedene Schemata
   ●   http://...
        ●   Lediglich eine registrierte Domain notwendig, um Eindeutigkeit zu
            sichern.
        ●   Möglichkeit, URIs mit beliebigen Inhalten zu dereferenzieren (RDF!)
   ●   PURL
        ●   Dienst von OCLC mit dem Vorteil, dass URIs dereferenzierbar bleiben,
            selbst wenn man die eigene Domain wieder aufgibt.
   ●   URN
        ●   Eingeschränkt dereferenzierbar über Resolver-Dienste
        ●   Aufwändige Registrierung über IANA
   ●   info:
        ●   Nicht referenzierbar, aber leichter zu registrieren als URN Namespaces.

Universitätsbibliothek Mannheim
Exkurs: Referenzen zu URIs
   ●   URI Schemes
       ●   http://www.iana.org/assignments/uri-schemes.html
   ●   Info URIs (info:<NID>/<NSS>)
       ●   http://info-uri.info/registry/OAIHandler?verb=ListRecords&metadataPrefix=oai_dc
       ●   info:lc
            –   http://info-uri.info/registry/OAIHandler?verb=GetRecord&metadataPrefix=reg&identifier=info:lc/

   ●   Uniform Resource Names (urn:<NID>:<NSS>)
       ●   http://www.iana.org/assignments/urn-namespaces/
       ●




Universitätsbibliothek Mannheim
SKOS: Ein Vokabular für (Werte-)
                       Vokabulare
   ●   SKOS = Simple Knowledge Organization System
   ●   Knowledge Organisation Systems (KOS) bezeichnen Systeme
       zur Wissensorganisation, wie
       ●   Normdateien, Glossare, Wörterbücher, Ortsverzeichnisse,
           Schlagwortkataloge, Klassifikationen. Thesauri, Semantische
           Netzwerke, Ontologien, ...
   ●   „Simple“ drückt aus, dass auf einige Merkmale zur
       Repräsentation von KOS verzichtet wird.
   ●   Ein „gemeinsamer Nenner“ zur Repräsentation von Thesauri,
       Klassifikationen und Schlagwortkatalogen.




Universitätsbibliothek Mannheim
SKOS auf einer Folie
   ●   Zentrale Begriff: Das Konzept (concept)
   ●   Konzepte werden zusammengefasst zu einem concept-
       scheme
   ●   Konzepte können mit Bezeichnern in verschiedenen Sprachen
       versehen werden: label
   ●   Identifikation und Dokumentation: notation, note,
       changeNote, definition, editorialNote, example,
       historyNote, scopeNote
   ●   Konzepte können verlinkt werden: broader, narrower,
       related
   ●   Schließlich: Mapping und Gruppierung


Universitätsbibliothek Mannheim
SKOS Vokabular
   ●   Concept               ●    editorialNote        ●   OrderedCollection
   ●   ConceptScheme         ●    example              ●   Member
   ●   inScheme              ●    historyNote          ●   MemberList
   ●   hasTopConcept         ●    note                 ●   broadMatch
   ●   topConceptOf          ●    scopeNote            ●   closeMatch
   ●   altLabel              ●    Broader              ●   exactMatch
   ●   hiddenLabel           ●    broaderTransitive    ●   mappingRelation
   ●   prefLabel             ●    narrower             ●   narrowMatch
   ●   notation              ●    NarrowerTransitive   ●   relatedMatch
   ●   RelatedMatch          ●    Related
   ●   changeNote            ●    SemanticRelation
   ●   definition            ●    Collection


Universitätsbibliothek Mannheim
SKOS XL
   ●   SKOS Extension for Labels (XL)
   ●   Hauptpunkte:
       ●   Lexikalisch identische Labels müssen nicht identisch sein
       ●   Erlaubt semantische Relationen zwischen Labels
   ●   Insbesondere zur Implementierung von Relationen wie
       acronym, use, used for, ...




Universitätsbibliothek Mannheim
Beispiel TheSoz
   ●   Thesaurus der Sozialwissenschaften
   ●   11.600 Terme, davon 7.750 Deskriptoren (Schlagwörter)
   ●   Komplexe Relationen wie „Use for combination“ oder „Used for
       combination“.
   ●   Besonderheit: 200 Nicht-Deskriptoren zur Disambiguierung:
       ●   Beispiel: Der alternative Nicht-Deskriptor „Erhebung“ enthält die
           Relationen „Use Datengewinnung“, „Use Revolution“ sowie „Use
           Widerstand“, die alle gleichwertig zu behandeln sind, und behandelt
           dadurch die Mehrdeutigkeit des Begriffes „Erhebung“.
   ●   Zusätzlich existiert eine parallele Klassifikationshierarchie, der
       die Deskriptoren zugeordnet werden.


Universitätsbibliothek Mannheim
Beispielimplementierung: TheSoz in SKOS (benutzt SKOS-XL)
 Element       Beschreibung / Funktion                                   SKOS Klasse / Property
 DD            Deskriptor                                                skosxl:prefLabel
 ND            Nicht-Deskriptor                                          skosxl:altLabel
 AD            Alternativer Nicht-Deskriptor                             skosxl:altLabel
 NT            Unterbegriff (Narrower Term)                              skos:narrower
 BT            Oberbegriff (Broader Term)                                skos:broader
 RT            Verwandter Term (Related Term)                            skos:related
 USE           Benutze Y statt X (Use)                                   ext:USE als Property der Klasse
                                                                         ext:equivalenceRelationship
 UF            Gegenteil von USE: Y benutzt statt X (Used For)           ext:UF als Property der Klasse
                                                                         ext:equivalenceRelationship
 USK           Benutze Kombination X UND Y (Use Combination)             ext:preferredTermComponent als Property
                                                                         der Klasse ext:CompoundEquivalence
 UFK           Gegenteil von USK: Benutzt für X mit Y (Used For          ext:compoundNonPreferredTerm und
               Combination)                                              ext:preferredTermComponent als Properties
                                                                         der Klasse ext:CompoundEquivalence
 translation   Engl. Übersetzung des Terms                               ext:hasTranslation
 scope         Scope Notes                                               skos:scopeNote
 Notation      Numerischer Code der systematischen Klassifikation, der   skos:notation
 code          der Term zuzuordnen ist



Universitätsbibliothek Mannheim
Beispiel STW
   ●   Standard Thesaurus Wirtschaft, http://zbw.eu/stw/
   ●   5.800 Schlagwörter
   ●   17.000 Terme
   ●   Spezialität: Übergeordnete hierarchische Klassifikation zur
       Untergliederung der Schlagwörter mit 500 Klassen
   ●   Ziel: Einheitliche Hierarchie, aber weiterhin Unterscheidung
       zwischen der Klassifikation und den eigentlichen, zur
       Verschlagwortung verwendeten, Schlagwörtern.
   ●   Möglich durch Einführung neuer RDF-Klassen, die als
       Unterklassen von skos:concept definiert sind.



Universitätsbibliothek Mannheim
Implementierung STW in SKOS
   ●   Neue Unterklassen von skos:Concept:
       ●   zbwext:Descriptor: „Normale“ Konzepte
       ●   zbwext:Thsys: Klassen aus der übergeordneten Hierarchie zur
           Klassifikation der Konzepte, werden nicht zur Beschreibung von
           Dokumenten genutzt.
   ●   Neue Unterklasse von skos:note:
       ●   zbwext:useInsteadNote: Enthält Hinweise über „Use Instead“-
           Relationen zwischen Termen, die nicht verloren gehen sollen.




Universitätsbibliothek Mannheim
Weitere SKOS Projekte
   ●   Standard Thesaurus Wirtschaft (ZBW)
   ●   Thesaurus für die Sozialwissenschaften (Gesis)
   ●   General Multilingual Environmental Thesaurus
   ●   UK Archival Thesaurus
   ●   UK Government Category List
   ●   AGROVOC FAO Agricultural Thesaurus
   ●   WordNet
   ●   LCSH
   ●




Universitätsbibliothek Mannheim
Linked Data




Universitätsbibliothek Mannheim
Die Daten kommen...




Universitätsbibliothek Mannheim
Linked Open Data der Bibliotheken
   ●   Katalog der Universitäts- und Stadtbibliothek Köln (USB)
   ●   Katalog der Hochschulbibliothek der Fachhochschule Köln
   ●   Katalog der Bibliothek/Mediathek der Kunsthochschule für
       Medien Köln
   ●   Katalog des Landesbibliothekszentrums Rheinland-Pfalz (LBZ),
       PLB Speyer
   ●   Katalog des Landesbibliothekszentrums Rheinland-Pfalz (LBZ),
       RLB Koblenz
   ●   Katalog des Landesbibliothekszentrums Rheinland-Pfalz (LBZ),
       BB Zweibrücken
   ●   → 5,4 Millionen Datensätze

Universitätsbibliothek Mannheim
Beispiel: New York Times
   ●   Veröffentlicht seit 2009 den New York Times Index als Linked
       Open Data (Stand: März 2010):
       ●   4.978 Personen
       ●   3.081 Organisationen
       ●   1.910 Orte
   ●   http://data.nytimes.com/
   ●   Linked Data:
       ●   Eigene Daten, Verknüpfungen zu Artikeln, Provenienz-Informationen
       ●   Verknüpft mit geonames.org, dbpedia, freebase, ...




Universitätsbibliothek Mannheim
Beispiel: DBLP
   ●   DBLP Projekt: http://www.informatik.uni-trier.de/~ley/db/
   ●   Veröffentlichung als RDF: http://www4.wiwiss.fu-berlin.de/dblp/
   ●   Hauptsächlich Dublin Core und FOAF Vokabular




Universitätsbibliothek Mannheim
Referenzen
   ●   Adolphus (2010): The Semantic Web – a new tool for libraries?
       ●   http://info.emeraldinsight.com/librarians/info/viewpoints/semantic_web.htm
   ●   Borst, Neubert (2009): Case Study: Publishing STW Thesaurus
       for Economics as Linked Open Data
       ●   http://www.w3.org/2001/sw/sweo/public/UseCases/ZBW/
   ●   Neubert (2009):Bringing the „Thesaurus for Economics“ on to the
       Web of Linked Data
       ●   http://events.linkeddata.org/ldow2009/papers/ldow2009_paper7.pdf
   ●   Zapilko, Sure (2009): Converting the TheSoz to SKOS
       ●   http://www.gesis.org/fileadmin/upload/forschung/publikationen/gesis_reihen/gesis_methodenberichte/2009/TechnicalReport_09_07.pdf

   ●   Van Assem et al. (2006): A Method to Convert Thesauri to SKOS
       ●   http://thesauri.cs.vu.nl/eswc06/

Universitätsbibliothek Mannheim
Fragen und Diskussion




   ●   Kontakt: Kai Eckert    -   eckert@bib.uni-mannheim.de




Universitätsbibliothek Mannheim

Mais conteúdo relacionado

Semelhante a Semantic Web, SKOS und Linked Data

Anforderungen an Thesauri im Semantic Web
Anforderungen an Thesauri im Semantic WebAnforderungen an Thesauri im Semantic Web
Anforderungen an Thesauri im Semantic WebJoachim Neubert
 
Semantic technologies
Semantic technologiesSemantic technologies
Semantic technologiesuniverse543
 
Repositorieninhalte als Linked Data bereitstellen
Repositorieninhalte als Linked Data bereitstellenRepositorieninhalte als Linked Data bereitstellen
Repositorieninhalte als Linked Data bereitstellenPascal-Nicolas Becker
 
Magdeburg | 2010-07-12 | Einführung in das Semantic Web
Magdeburg | 2010-07-12 | Einführung in das Semantic WebMagdeburg | 2010-07-12 | Einführung in das Semantic Web
Magdeburg | 2010-07-12 | Einführung in das Semantic WebWebmontag
 
Sitzung 7
Sitzung 7Sitzung 7
Sitzung 7scuy
 
Linked Open Data in der Praxis, Kerstin Arnold
Linked Open Data in der Praxis, Kerstin ArnoldLinked Open Data in der Praxis, Kerstin Arnold
Linked Open Data in der Praxis, Kerstin ArnoldKerstin Arnold
 
AMSL Kick-off-Meeting sächsischer Hochschulbibliotheken
AMSL Kick-off-Meeting sächsischer HochschulbibliothekenAMSL Kick-off-Meeting sächsischer Hochschulbibliotheken
AMSL Kick-off-Meeting sächsischer HochschulbibliothekenBjörn Muschall
 
Kickoff Workshop zum Projekt amsl mit den sächsischen Hochschulbibliotheken
Kickoff Workshop zum Projekt amsl mit den sächsischen HochschulbibliothekenKickoff Workshop zum Projekt amsl mit den sächsischen Hochschulbibliotheken
Kickoff Workshop zum Projekt amsl mit den sächsischen HochschulbibliothekenLydiaU
 
Zur texttechnologischen Modellierung linguistischer Korpora
Zur texttechnologischen Modellierung linguistischer KorporaZur texttechnologischen Modellierung linguistischer Korpora
Zur texttechnologischen Modellierung linguistischer KorporaGeorg Rehm
 
LinkedGeodata (Deutsch)
LinkedGeodata (Deutsch)LinkedGeodata (Deutsch)
LinkedGeodata (Deutsch)geoknow
 
Sitzung 6
Sitzung 6Sitzung 6
Sitzung 6scuy
 
amsl - Ergebnispräsentation der EFRE-Förderphase
amsl - Ergebnispräsentation der EFRE-Förderphaseamsl - Ergebnispräsentation der EFRE-Förderphase
amsl - Ergebnispräsentation der EFRE-FörderphaseBjörn Muschall
 
Präsentation amsl Deutscher Bibliothekartag 2014 ERM
Präsentation amsl Deutscher Bibliothekartag 2014 ERMPräsentation amsl Deutscher Bibliothekartag 2014 ERM
Präsentation amsl Deutscher Bibliothekartag 2014 ERMLydiaU
 
Projekt AMSL: Entwicklung eines Electronic Resource Management Systems für Bi...
Projekt AMSL: Entwicklung eines Electronic Resource Management Systems für Bi...Projekt AMSL: Entwicklung eines Electronic Resource Management Systems für Bi...
Projekt AMSL: Entwicklung eines Electronic Resource Management Systems für Bi...Björn Muschall
 
Wissenstechnologie 2007- III
Wissenstechnologie 2007- IIIWissenstechnologie 2007- III
Wissenstechnologie 2007- IIIpscheir
 

Semelhante a Semantic Web, SKOS und Linked Data (20)

Anforderungen an Thesauri im Semantic Web
Anforderungen an Thesauri im Semantic WebAnforderungen an Thesauri im Semantic Web
Anforderungen an Thesauri im Semantic Web
 
Semantic technologies
Semantic technologiesSemantic technologies
Semantic technologies
 
Repositorieninhalte als Linked Data bereitstellen
Repositorieninhalte als Linked Data bereitstellenRepositorieninhalte als Linked Data bereitstellen
Repositorieninhalte als Linked Data bereitstellen
 
Repositorieninhalte als LinkedData bereitstellen
Repositorieninhalte als LinkedData bereitstellenRepositorieninhalte als LinkedData bereitstellen
Repositorieninhalte als LinkedData bereitstellen
 
Magdeburg | 2010-07-12 | Einführung in das Semantic Web
Magdeburg | 2010-07-12 | Einführung in das Semantic WebMagdeburg | 2010-07-12 | Einführung in das Semantic Web
Magdeburg | 2010-07-12 | Einführung in das Semantic Web
 
Linked Library Data & RDA
Linked Library Data & RDALinked Library Data & RDA
Linked Library Data & RDA
 
Sitzung 7
Sitzung 7Sitzung 7
Sitzung 7
 
Linked Open Data in der Praxis, Kerstin Arnold
Linked Open Data in der Praxis, Kerstin ArnoldLinked Open Data in der Praxis, Kerstin Arnold
Linked Open Data in der Praxis, Kerstin Arnold
 
AMSL Kick-off-Meeting sächsischer Hochschulbibliotheken
AMSL Kick-off-Meeting sächsischer HochschulbibliothekenAMSL Kick-off-Meeting sächsischer Hochschulbibliotheken
AMSL Kick-off-Meeting sächsischer Hochschulbibliotheken
 
Kickoff Workshop zum Projekt amsl mit den sächsischen Hochschulbibliotheken
Kickoff Workshop zum Projekt amsl mit den sächsischen HochschulbibliothekenKickoff Workshop zum Projekt amsl mit den sächsischen Hochschulbibliotheken
Kickoff Workshop zum Projekt amsl mit den sächsischen Hochschulbibliotheken
 
Zur texttechnologischen Modellierung linguistischer Korpora
Zur texttechnologischen Modellierung linguistischer KorporaZur texttechnologischen Modellierung linguistischer Korpora
Zur texttechnologischen Modellierung linguistischer Korpora
 
WiSe 2013 | IT-Zertifikat: AMM - Semantic Web II: RDF und FOAF
WiSe 2013 | IT-Zertifikat: AMM - Semantic Web II: RDF und FOAFWiSe 2013 | IT-Zertifikat: AMM - Semantic Web II: RDF und FOAF
WiSe 2013 | IT-Zertifikat: AMM - Semantic Web II: RDF und FOAF
 
LinkedGeodata (Deutsch)
LinkedGeodata (Deutsch)LinkedGeodata (Deutsch)
LinkedGeodata (Deutsch)
 
Sitzung 6
Sitzung 6Sitzung 6
Sitzung 6
 
SoSe 2013 | IT-Zertifikat: AMM - Klausurvorbereitung
 SoSe 2013 | IT-Zertifikat: AMM - Klausurvorbereitung SoSe 2013 | IT-Zertifikat: AMM - Klausurvorbereitung
SoSe 2013 | IT-Zertifikat: AMM - Klausurvorbereitung
 
Bit sosem 2016-wieners-sitzung-08_semantic-web
Bit sosem 2016-wieners-sitzung-08_semantic-webBit sosem 2016-wieners-sitzung-08_semantic-web
Bit sosem 2016-wieners-sitzung-08_semantic-web
 
amsl - Ergebnispräsentation der EFRE-Förderphase
amsl - Ergebnispräsentation der EFRE-Förderphaseamsl - Ergebnispräsentation der EFRE-Förderphase
amsl - Ergebnispräsentation der EFRE-Förderphase
 
Präsentation amsl Deutscher Bibliothekartag 2014 ERM
Präsentation amsl Deutscher Bibliothekartag 2014 ERMPräsentation amsl Deutscher Bibliothekartag 2014 ERM
Präsentation amsl Deutscher Bibliothekartag 2014 ERM
 
Projekt AMSL: Entwicklung eines Electronic Resource Management Systems für Bi...
Projekt AMSL: Entwicklung eines Electronic Resource Management Systems für Bi...Projekt AMSL: Entwicklung eines Electronic Resource Management Systems für Bi...
Projekt AMSL: Entwicklung eines Electronic Resource Management Systems für Bi...
 
Wissenstechnologie 2007- III
Wissenstechnologie 2007- IIIWissenstechnologie 2007- III
Wissenstechnologie 2007- III
 

Mais de Kai Eckert

Judaica link und der FID Jüdische Studien
Judaica link und der FID Jüdische StudienJudaica link und der FID Jüdische Studien
Judaica link und der FID Jüdische StudienKai Eckert
 
Linked Open Citation Database (LOC-DB)
Linked Open Citation Database (LOC-DB)Linked Open Citation Database (LOC-DB)
Linked Open Citation Database (LOC-DB)Kai Eckert
 
JudaicaLink: Linked Data in the Jewish Studies FID
JudaicaLink: Linked Data in the Jewish Studies FIDJudaicaLink: Linked Data in the Jewish Studies FID
JudaicaLink: Linked Data in the Jewish Studies FIDKai Eckert
 
Linked Data nach dem Hype
Linked Data nach dem HypeLinked Data nach dem Hype
Linked Data nach dem HypeKai Eckert
 
Guidance, Please! Towards a Framework for RDF-based Constraint Languages.
Guidance, Please! Towards a Framework for RDF-based Constraint Languages.Guidance, Please! Towards a Framework for RDF-based Constraint Languages.
Guidance, Please! Towards a Framework for RDF-based Constraint Languages.Kai Eckert
 
JudaicaLink: Linked Data from Jewish Encyclopediae
JudaicaLink: Linked Data from Jewish EncyclopediaeJudaicaLink: Linked Data from Jewish Encyclopediae
JudaicaLink: Linked Data from Jewish EncyclopediaeKai Eckert
 
RDF Application Profiles
RDF Application ProfilesRDF Application Profiles
RDF Application ProfilesKai Eckert
 
Specialising the EDM for Digitised Manuscript (SWIB13)
Specialising the EDM for Digitised Manuscript (SWIB13)Specialising the EDM for Digitised Manuscript (SWIB13)
Specialising the EDM for Digitised Manuscript (SWIB13)Kai Eckert
 
Metadata Provenance Tutorial at SWIB 13, Part 1
Metadata Provenance Tutorial at SWIB 13, Part 1Metadata Provenance Tutorial at SWIB 13, Part 1
Metadata Provenance Tutorial at SWIB 13, Part 1Kai Eckert
 
The DM2E Data Model and the DM2E Ingestion Infrastructure
The DM2E Data Model and the DM2E Ingestion InfrastructureThe DM2E Data Model and the DM2E Ingestion Infrastructure
The DM2E Data Model and the DM2E Ingestion InfrastructureKai Eckert
 
LOHAI: Providing a baseline for KOS based automatic indexing
LOHAI: Providing a baseline for KOS based automatic indexingLOHAI: Providing a baseline for KOS based automatic indexing
LOHAI: Providing a baseline for KOS based automatic indexingKai Eckert
 
Extending DCAM for Metadata Provenance
Extending DCAM for Metadata ProvenanceExtending DCAM for Metadata Provenance
Extending DCAM for Metadata ProvenanceKai Eckert
 
Bibliotheken und Linked Open Data - Erfahrungen und Ideen aus der UB Mannheim
Bibliotheken und Linked Open Data - Erfahrungen und Ideen aus der UB Mannheim Bibliotheken und Linked Open Data - Erfahrungen und Ideen aus der UB Mannheim
Bibliotheken und Linked Open Data - Erfahrungen und Ideen aus der UB Mannheim Kai Eckert
 
Thesaurusvisualisierung mit ICE-Map und SEMTINEL
Thesaurusvisualisierung mit ICE-Map und SEMTINELThesaurusvisualisierung mit ICE-Map und SEMTINEL
Thesaurusvisualisierung mit ICE-Map und SEMTINELKai Eckert
 
SWIB 2010: Linked Open Projects
SWIB 2010: Linked Open ProjectsSWIB 2010: Linked Open Projects
SWIB 2010: Linked Open ProjectsKai Eckert
 
Towards Interoperable Metadata Provenance
Towards Interoperable Metadata ProvenanceTowards Interoperable Metadata Provenance
Towards Interoperable Metadata ProvenanceKai Eckert
 
Linked Open Projects (DCMI Library Community)
Linked Open Projects (DCMI Library Community)Linked Open Projects (DCMI Library Community)
Linked Open Projects (DCMI Library Community)Kai Eckert
 
Metadata Provenance
Metadata ProvenanceMetadata Provenance
Metadata ProvenanceKai Eckert
 
Linked Open Projects (DGI-Konferenz)
Linked Open Projects (DGI-Konferenz)Linked Open Projects (DGI-Konferenz)
Linked Open Projects (DGI-Konferenz)Kai Eckert
 
Linked Open Projects
Linked Open ProjectsLinked Open Projects
Linked Open ProjectsKai Eckert
 

Mais de Kai Eckert (20)

Judaica link und der FID Jüdische Studien
Judaica link und der FID Jüdische StudienJudaica link und der FID Jüdische Studien
Judaica link und der FID Jüdische Studien
 
Linked Open Citation Database (LOC-DB)
Linked Open Citation Database (LOC-DB)Linked Open Citation Database (LOC-DB)
Linked Open Citation Database (LOC-DB)
 
JudaicaLink: Linked Data in the Jewish Studies FID
JudaicaLink: Linked Data in the Jewish Studies FIDJudaicaLink: Linked Data in the Jewish Studies FID
JudaicaLink: Linked Data in the Jewish Studies FID
 
Linked Data nach dem Hype
Linked Data nach dem HypeLinked Data nach dem Hype
Linked Data nach dem Hype
 
Guidance, Please! Towards a Framework for RDF-based Constraint Languages.
Guidance, Please! Towards a Framework for RDF-based Constraint Languages.Guidance, Please! Towards a Framework for RDF-based Constraint Languages.
Guidance, Please! Towards a Framework for RDF-based Constraint Languages.
 
JudaicaLink: Linked Data from Jewish Encyclopediae
JudaicaLink: Linked Data from Jewish EncyclopediaeJudaicaLink: Linked Data from Jewish Encyclopediae
JudaicaLink: Linked Data from Jewish Encyclopediae
 
RDF Application Profiles
RDF Application ProfilesRDF Application Profiles
RDF Application Profiles
 
Specialising the EDM for Digitised Manuscript (SWIB13)
Specialising the EDM for Digitised Manuscript (SWIB13)Specialising the EDM for Digitised Manuscript (SWIB13)
Specialising the EDM for Digitised Manuscript (SWIB13)
 
Metadata Provenance Tutorial at SWIB 13, Part 1
Metadata Provenance Tutorial at SWIB 13, Part 1Metadata Provenance Tutorial at SWIB 13, Part 1
Metadata Provenance Tutorial at SWIB 13, Part 1
 
The DM2E Data Model and the DM2E Ingestion Infrastructure
The DM2E Data Model and the DM2E Ingestion InfrastructureThe DM2E Data Model and the DM2E Ingestion Infrastructure
The DM2E Data Model and the DM2E Ingestion Infrastructure
 
LOHAI: Providing a baseline for KOS based automatic indexing
LOHAI: Providing a baseline for KOS based automatic indexingLOHAI: Providing a baseline for KOS based automatic indexing
LOHAI: Providing a baseline for KOS based automatic indexing
 
Extending DCAM for Metadata Provenance
Extending DCAM for Metadata ProvenanceExtending DCAM for Metadata Provenance
Extending DCAM for Metadata Provenance
 
Bibliotheken und Linked Open Data - Erfahrungen und Ideen aus der UB Mannheim
Bibliotheken und Linked Open Data - Erfahrungen und Ideen aus der UB Mannheim Bibliotheken und Linked Open Data - Erfahrungen und Ideen aus der UB Mannheim
Bibliotheken und Linked Open Data - Erfahrungen und Ideen aus der UB Mannheim
 
Thesaurusvisualisierung mit ICE-Map und SEMTINEL
Thesaurusvisualisierung mit ICE-Map und SEMTINELThesaurusvisualisierung mit ICE-Map und SEMTINEL
Thesaurusvisualisierung mit ICE-Map und SEMTINEL
 
SWIB 2010: Linked Open Projects
SWIB 2010: Linked Open ProjectsSWIB 2010: Linked Open Projects
SWIB 2010: Linked Open Projects
 
Towards Interoperable Metadata Provenance
Towards Interoperable Metadata ProvenanceTowards Interoperable Metadata Provenance
Towards Interoperable Metadata Provenance
 
Linked Open Projects (DCMI Library Community)
Linked Open Projects (DCMI Library Community)Linked Open Projects (DCMI Library Community)
Linked Open Projects (DCMI Library Community)
 
Metadata Provenance
Metadata ProvenanceMetadata Provenance
Metadata Provenance
 
Linked Open Projects (DGI-Konferenz)
Linked Open Projects (DGI-Konferenz)Linked Open Projects (DGI-Konferenz)
Linked Open Projects (DGI-Konferenz)
 
Linked Open Projects
Linked Open ProjectsLinked Open Projects
Linked Open Projects
 

Semantic Web, SKOS und Linked Data

  • 1. Semantic Web, SKOS und Linked Data Kai Eckert 4. Leipziger Kongress für Information und Bibliothek, 16. März 2010 Workshop in Kooperation mit dem Kompetenzzentrum Interoperable Metadaten (KIM) Universitätsbibliothek Mannheim
  • 2. Was brauchen wir? ● Eine standardisierte Syntax ● Damit Metadaten überhaupt als solche erkannt werden! ● W3C: XML, RDF, RDF Schema, OWL ● Ein oder mehrere standardisierte Vokabularien ● Damit Suchmaschinen, Produzenten und Verbraucher die gleiche Sprache sprechen ● Jede Menge Resourcen, die durch Metadaten beschrieben sind. Universitätsbibliothek Mannheim
  • 3. RDF: Resource Description Framework map www.fourseasons.com/de/tokyo/ type Hotel location http://www.daml.org/2001/12 / name factbook/factbook- “Tokyo” ont#A53037 Universitätsbibliothek Mannheim
  • 4. Vokabularien ● Dublin Core ● FRBR ● FOAF ● SKOS ● SIOC Das Vokabular für die RDF-Daten. Beschreibung in RDF Schema und OWL Nicht zu verwechseln mit den bibliothekarischen Vokabularien: Wertevokabularien Universitätsbibliothek Mannheim
  • 5. Was sind RDF-Daten? ● Tripel, die Aussagen (Statements) darstellen: ● Subjekt, Prädikat, Objekt ● Beispiel: Deutschland hat als Hauptstadt Berlin. ● Das Subjekt und das Prädikat einer Aussage müssen innerhalb von RDF als URI eindeutig bezeichnet werden. ● Als Objekt können URIs oder Datenwerte (Literale) verwendet werden. ● Beispiel in RDF: ● ex:locations/germany ex:vocab/capital ex:locations/berlin ● ex:locations/germany ex:vocab/name „Deutschland“ ● ex:locations/berlin ex:vocab/name „Berlin“ Universitätsbibliothek Mannheim
  • 6. Die Schönheit von URIs ● Aussagen über Ressourcen können unabhängig von den Ressourcen selbst getätigt werden: http://doi.acm.org/10.1145/1298406.1298426 http://purl.org/dc/elements/1.1/creator Verschiedene Orte! Verschiedene Besitzer! http://dblp.uni-trier.de/rec/pers/e/Eckert:Kai/ doi:10.1145/1298406.1298426 dc:creator dblp:pers/e/Eckert:Kai/ Universitätsbibliothek Mannheim
  • 7. Die Eindeutigkeit von URIs ● Eine URI beschreibt eindeutig und (hoffentlich) dauerhaft eine ganz bestimmte Ressource. ● http://dblp.uni-trier.de/rec/pers/e/Eckert:Kai/ ● Aber: Eine Ressource kann durch verschiedene URIs beschrieben werden ● http://dblp.uni-trier.de/rec/pers/e/Eckert:Kai/ ● http://ki.informatik.uni-mannheim.de/people/kai_eckert.html ● http://de.linkedin.com/in/kaieckert ● … ● Keine Eineindeutigkeit! Universitätsbibliothek Mannheim
  • 8. Ist das ein Problem? ● Die Äquivalenz von URIs lässt sich jederzeit und von jedem als RDF Statement ausdrücken: ● http://de.linkedin.com/in/kaieckert owl:sameAs ↵ http://dblp.uni-trier.de/rec/pers/e/Eckert:Kai/ ● Dadurch lassen sich insbesondere auch Prädikate (Vokabular) gleichsetzen. ● So lassen sich transparent Datenbestände mit anderen Datenbeständen verknüpfen. ● → Linked Data Universitätsbibliothek Mannheim
  • 9. Exkurs: URI Syntax ● <schema>:<Schema-spezifischer Teil> ● Beispiele ● http://www.bib.uni-mannheim.de/ ● mailto:eckert@bib.uni-mannheim.de ● http://purl.org/dc/elements/1.1/creator ● http://dublincore.org/2008/01/14/dcelements.rdf#creator ● info:lc/vocabulary/countries/af ● urn:nbn:de:gbv:089-3321752945 ● urn:isbn:0345391802 ● http://doi.acm.org/10.1145/1298406.1298426 ● http://dx.doi.org/10.1145/1298406.129842 Universitätsbibliothek Mannheim
  • 10. Exkurs: Verschiedene Schemata ● http://... ● Lediglich eine registrierte Domain notwendig, um Eindeutigkeit zu sichern. ● Möglichkeit, URIs mit beliebigen Inhalten zu dereferenzieren (RDF!) ● PURL ● Dienst von OCLC mit dem Vorteil, dass URIs dereferenzierbar bleiben, selbst wenn man die eigene Domain wieder aufgibt. ● URN ● Eingeschränkt dereferenzierbar über Resolver-Dienste ● Aufwändige Registrierung über IANA ● info: ● Nicht referenzierbar, aber leichter zu registrieren als URN Namespaces. Universitätsbibliothek Mannheim
  • 11. Exkurs: Referenzen zu URIs ● URI Schemes ● http://www.iana.org/assignments/uri-schemes.html ● Info URIs (info:<NID>/<NSS>) ● http://info-uri.info/registry/OAIHandler?verb=ListRecords&metadataPrefix=oai_dc ● info:lc – http://info-uri.info/registry/OAIHandler?verb=GetRecord&metadataPrefix=reg&identifier=info:lc/ ● Uniform Resource Names (urn:<NID>:<NSS>) ● http://www.iana.org/assignments/urn-namespaces/ ● Universitätsbibliothek Mannheim
  • 12. SKOS: Ein Vokabular für (Werte-) Vokabulare ● SKOS = Simple Knowledge Organization System ● Knowledge Organisation Systems (KOS) bezeichnen Systeme zur Wissensorganisation, wie ● Normdateien, Glossare, Wörterbücher, Ortsverzeichnisse, Schlagwortkataloge, Klassifikationen. Thesauri, Semantische Netzwerke, Ontologien, ... ● „Simple“ drückt aus, dass auf einige Merkmale zur Repräsentation von KOS verzichtet wird. ● Ein „gemeinsamer Nenner“ zur Repräsentation von Thesauri, Klassifikationen und Schlagwortkatalogen. Universitätsbibliothek Mannheim
  • 13. SKOS auf einer Folie ● Zentrale Begriff: Das Konzept (concept) ● Konzepte werden zusammengefasst zu einem concept- scheme ● Konzepte können mit Bezeichnern in verschiedenen Sprachen versehen werden: label ● Identifikation und Dokumentation: notation, note, changeNote, definition, editorialNote, example, historyNote, scopeNote ● Konzepte können verlinkt werden: broader, narrower, related ● Schließlich: Mapping und Gruppierung Universitätsbibliothek Mannheim
  • 14. SKOS Vokabular ● Concept ● editorialNote ● OrderedCollection ● ConceptScheme ● example ● Member ● inScheme ● historyNote ● MemberList ● hasTopConcept ● note ● broadMatch ● topConceptOf ● scopeNote ● closeMatch ● altLabel ● Broader ● exactMatch ● hiddenLabel ● broaderTransitive ● mappingRelation ● prefLabel ● narrower ● narrowMatch ● notation ● NarrowerTransitive ● relatedMatch ● RelatedMatch ● Related ● changeNote ● SemanticRelation ● definition ● Collection Universitätsbibliothek Mannheim
  • 15. SKOS XL ● SKOS Extension for Labels (XL) ● Hauptpunkte: ● Lexikalisch identische Labels müssen nicht identisch sein ● Erlaubt semantische Relationen zwischen Labels ● Insbesondere zur Implementierung von Relationen wie acronym, use, used for, ... Universitätsbibliothek Mannheim
  • 16. Beispiel TheSoz ● Thesaurus der Sozialwissenschaften ● 11.600 Terme, davon 7.750 Deskriptoren (Schlagwörter) ● Komplexe Relationen wie „Use for combination“ oder „Used for combination“. ● Besonderheit: 200 Nicht-Deskriptoren zur Disambiguierung: ● Beispiel: Der alternative Nicht-Deskriptor „Erhebung“ enthält die Relationen „Use Datengewinnung“, „Use Revolution“ sowie „Use Widerstand“, die alle gleichwertig zu behandeln sind, und behandelt dadurch die Mehrdeutigkeit des Begriffes „Erhebung“. ● Zusätzlich existiert eine parallele Klassifikationshierarchie, der die Deskriptoren zugeordnet werden. Universitätsbibliothek Mannheim
  • 17. Beispielimplementierung: TheSoz in SKOS (benutzt SKOS-XL) Element Beschreibung / Funktion SKOS Klasse / Property DD Deskriptor skosxl:prefLabel ND Nicht-Deskriptor skosxl:altLabel AD Alternativer Nicht-Deskriptor skosxl:altLabel NT Unterbegriff (Narrower Term) skos:narrower BT Oberbegriff (Broader Term) skos:broader RT Verwandter Term (Related Term) skos:related USE Benutze Y statt X (Use) ext:USE als Property der Klasse ext:equivalenceRelationship UF Gegenteil von USE: Y benutzt statt X (Used For) ext:UF als Property der Klasse ext:equivalenceRelationship USK Benutze Kombination X UND Y (Use Combination) ext:preferredTermComponent als Property der Klasse ext:CompoundEquivalence UFK Gegenteil von USK: Benutzt für X mit Y (Used For ext:compoundNonPreferredTerm und Combination) ext:preferredTermComponent als Properties der Klasse ext:CompoundEquivalence translation Engl. Übersetzung des Terms ext:hasTranslation scope Scope Notes skos:scopeNote Notation Numerischer Code der systematischen Klassifikation, der skos:notation code der Term zuzuordnen ist Universitätsbibliothek Mannheim
  • 18. Beispiel STW ● Standard Thesaurus Wirtschaft, http://zbw.eu/stw/ ● 5.800 Schlagwörter ● 17.000 Terme ● Spezialität: Übergeordnete hierarchische Klassifikation zur Untergliederung der Schlagwörter mit 500 Klassen ● Ziel: Einheitliche Hierarchie, aber weiterhin Unterscheidung zwischen der Klassifikation und den eigentlichen, zur Verschlagwortung verwendeten, Schlagwörtern. ● Möglich durch Einführung neuer RDF-Klassen, die als Unterklassen von skos:concept definiert sind. Universitätsbibliothek Mannheim
  • 19. Implementierung STW in SKOS ● Neue Unterklassen von skos:Concept: ● zbwext:Descriptor: „Normale“ Konzepte ● zbwext:Thsys: Klassen aus der übergeordneten Hierarchie zur Klassifikation der Konzepte, werden nicht zur Beschreibung von Dokumenten genutzt. ● Neue Unterklasse von skos:note: ● zbwext:useInsteadNote: Enthält Hinweise über „Use Instead“- Relationen zwischen Termen, die nicht verloren gehen sollen. Universitätsbibliothek Mannheim
  • 20. Weitere SKOS Projekte ● Standard Thesaurus Wirtschaft (ZBW) ● Thesaurus für die Sozialwissenschaften (Gesis) ● General Multilingual Environmental Thesaurus ● UK Archival Thesaurus ● UK Government Category List ● AGROVOC FAO Agricultural Thesaurus ● WordNet ● LCSH ● Universitätsbibliothek Mannheim
  • 23. Linked Open Data der Bibliotheken ● Katalog der Universitäts- und Stadtbibliothek Köln (USB) ● Katalog der Hochschulbibliothek der Fachhochschule Köln ● Katalog der Bibliothek/Mediathek der Kunsthochschule für Medien Köln ● Katalog des Landesbibliothekszentrums Rheinland-Pfalz (LBZ), PLB Speyer ● Katalog des Landesbibliothekszentrums Rheinland-Pfalz (LBZ), RLB Koblenz ● Katalog des Landesbibliothekszentrums Rheinland-Pfalz (LBZ), BB Zweibrücken ● → 5,4 Millionen Datensätze Universitätsbibliothek Mannheim
  • 24. Beispiel: New York Times ● Veröffentlicht seit 2009 den New York Times Index als Linked Open Data (Stand: März 2010): ● 4.978 Personen ● 3.081 Organisationen ● 1.910 Orte ● http://data.nytimes.com/ ● Linked Data: ● Eigene Daten, Verknüpfungen zu Artikeln, Provenienz-Informationen ● Verknüpft mit geonames.org, dbpedia, freebase, ... Universitätsbibliothek Mannheim
  • 25. Beispiel: DBLP ● DBLP Projekt: http://www.informatik.uni-trier.de/~ley/db/ ● Veröffentlichung als RDF: http://www4.wiwiss.fu-berlin.de/dblp/ ● Hauptsächlich Dublin Core und FOAF Vokabular Universitätsbibliothek Mannheim
  • 26. Referenzen ● Adolphus (2010): The Semantic Web – a new tool for libraries? ● http://info.emeraldinsight.com/librarians/info/viewpoints/semantic_web.htm ● Borst, Neubert (2009): Case Study: Publishing STW Thesaurus for Economics as Linked Open Data ● http://www.w3.org/2001/sw/sweo/public/UseCases/ZBW/ ● Neubert (2009):Bringing the „Thesaurus for Economics“ on to the Web of Linked Data ● http://events.linkeddata.org/ldow2009/papers/ldow2009_paper7.pdf ● Zapilko, Sure (2009): Converting the TheSoz to SKOS ● http://www.gesis.org/fileadmin/upload/forschung/publikationen/gesis_reihen/gesis_methodenberichte/2009/TechnicalReport_09_07.pdf ● Van Assem et al. (2006): A Method to Convert Thesauri to SKOS ● http://thesauri.cs.vu.nl/eswc06/ Universitätsbibliothek Mannheim
  • 27. Fragen und Diskussion ● Kontakt: Kai Eckert - eckert@bib.uni-mannheim.de Universitätsbibliothek Mannheim