Open Data Support - bridging open data supply and demand
D2.1.3 training module 2.4 designing and developing vocabularies in rdf v0.01 de
1. DATA
SUPPORT
OPEN
Trainingsmodul 2.4
RDF-Vokabulare
entwerfen und
entwickeln
Die Mitglieder des PwC Netzwerks unterstützen Organisationen und Individuen dabei, die Werte zu schaffen, nach denen sie suchen. Wir sind ein Netzwerk von Unternehmen mit nahezu 180.000
Mitarbeitern in 158 Ländern, die sich dazu verpflichtet fühlen Qualität in den Bereichen Assurance, Tax & Legal sowie Advisory zu liefern. Sagen Sie uns, was Ihnen wichtig ist und besuchen Sie für
weitere Informationen unsere Webseite www.pwc.com
PwC bezieht sich auf das PwC Netzwerk und/oder eine oder mehrere Mitgliedsfirmen, von denen jede ein rechtlich selbstständiges Unternehmen ist. Besuchen Sie unsere Webseite
www.pwc.com/structure für weitere Details.
3. DATASUPPORTOPEN
Lernziele
Am Ende dieses Trainingsmoduls sollten Sie wissen:
• was die Best-Practices bei der Erstellung eines RDF Vokabulars sind,
mit dem Sie Ihre Daten modellieren können.
• wo Sie RDF Vokabulare zur Wiederverwendung finden können.
• wie Sie Ihr eigenes RDF-Vokabular erstellen können.
• wie Sie Ihre RDF-Vokabulare veröffentlichen können.
• wie der Prozess und die Methodik zur Entwicklung semantischer
Vereinbarungen funktionieren, die vom ISA-Programm der
Europäischen Kommission entwickelt wurden.
Folie 3
4. DATASUPPORTOPEN
Inhalt
In diesem Modul geht es...
• um die einzelnen Schritte bei der Modellierung Ihrer Daten.
• darum, wie Sie vorhandene Vokabulare wiederverwenden können,
um Ihre Daten zu modellieren.
• darum, wie Sie neue Klassen und Eigenschaften in RDF erstellen
können.
• darum, wie und wo Sie Ihr RDF-Vokabular veröffentlichen können,
damit es von Anderen wiederverwendet werden kann.
Folie 4
5. DATASUPPORTOPEN
RDF-Vokabular
Folie 5
„Ein Vokabular ist ein Datenmodell, das Klassen, Eigenschaften und
Beziehungen beinhaltet, die dazu genutzt werden können Ihre Daten
und Metadaten zu beschreiben.”
RDF Vokabulare sind Sammlungen von Begriffen, die dazu genutzt
werden können Dinge zu beschreiben.
Ein Begriff ist entweder eine Klasse oder eine Eigenschaft.
Objekttyp Eigenschaften (Beziehungen)
Datentyp Eigenschaften (Attribute)
6. DATASUPPORTOPEN
Was sind Klassen, Beziehungen und Eigenschaften?
Klasse. Ein Konstrukt, das Dinge in der realen und/oder virtuellen
Welt darstellt, z.B. eine Person, eine Organisation oder ein Konzept wie
“Gesundheit” oder “Freiheit”.
Beziehung. Eine Verbindung zwischen zwei Klassen: zwischen einem
Dokument und der Organisation, die es veröffentlicht hat (d.h.
Organisation veröffentlicht Dokument); oder zwischen einer Karte und
der geografischen Region, die sie zeigt (d.h. Karte zeigt geografische
Region). In RDF werden Beziehungen als Objekttyp Eigenschaften
kodiert.
Eigenschaft. Eine Eigenschaft einer Klasse in einer bestimmten
Dimension, wie z.B. der offizielle Name einer Organisation oder das
Datum und die Zeit, wann ein Beobachtung gemacht wurde.
Folie 6
7. DATASUPPORTOPEN Folie 7
Beispiele für Klassen, Beziehungen und Eigenschaften
http://.../org/217279
8119
Ort
http://example.com/site
/1234
RegisteredOrganisation Address
Dahliastraat 24, 2160
Wommelgem“Nike”
a a
fullAddresslegalName
KlasseEigenschaft
Beziehung
8. DATASUPPORTOPEN
Modellieren Sie Ihre
Daten
Wie Sie andere Vokabulare wiederverwenden, Ihre
eigenen Begriffe definieren und Ihre Vokabulare
veröffentlichen und bewerben können, um damit Daten zu
beschreiben.
Folie 8
9. DATASUPPORTOPEN
6 Schritte bei der Modellierung Ihrer Daten
Beginnen Sie mit einem festen Domainmodell, das nach
einem strukturierten Prozess und Methodik entwickelt wurde.
Recherchieren Sie vorhandene Begriffe sowie deren Nutzung
und maximieren Sie die Wiederverwendung dieser Begriffe.
Dort, wo neue Begriffe als Spezialisierungen von vorhandenen
Begriffen betrachten werden können, erstellen Sie Unterklassen
und Untereigenschaften.
Wenn neue Begriffe erforderlich sind, erstellen Sie sie gemäß
allgemein anerkannter Best-Practices.
Veröffentlichen Sie Ihre Daten innerhalb einer sehr stabilen
Umgebung, die erstellt wurde um persistent zu sein.
Publizieren Sie das RDF-Schema, indem sie es auf relevanten
Services registrieren.
Folie 9
1
Siehe auch:
https://joinup.ec.europa.eu/community/semic/document/
cookbook-translating-data-models-rdf-schemas
2
3
4
5
6
10. DATASUPPORTOPEN
Beginnen Sie mit einem robusten Domainmodell
Folie 10
1
class Domain Model
RegisteredOrganisation
- identifier
- name
- registrationDate
- status
- type
Address
- identifier
- fullAddress
- postcode
ContactPoint
- identifier
- name
- telephone
- email
- fax
- website
Activity
- identifier
- name
Certificate
- identifier
- name
location
organisationCertificate
contactInformation
organisationActivity
11. DATASUPPORTOPEN
Verwenden Sie vorhandene Begriffe und
Vokabulare wieder
• Universalvokabulare: DCMI, RDFS
• Um Dinge zu benennen: rdfs:label, foaf:name, skos:prefLabel
• Um Leute zu beschreiben: FOAF, vCard, Core Person Vocabulary
• Um Projekte zu beschreiben: DOAP, ADMS.SW
• Um eine semantische Interoperabilität zu beschreiben: ADMS
• Um registrierte Organisationen zu beschreiben: Registered
Organisation Vocabulary
• Um Adressen zu beschreiben: vCard, Core Location Vocabulary
• Um öffentliche Dienstleistungen zu beschreiben: Core Public Service
Vocabulary
• Um Datensätze zu beschreiben: DCAT, DCAT Anwendungsprofil,
VoID
Folie 11
2
12. DATASUPPORTOPEN
Anwendungsprofile erstellen
• Unterschiedliche Domains haben unterschiedliche Anforderungen
an die domainspezifische Semantik, z.B. Klassifikationskonzepte.
• Generische RDF-Vokabulare liefern normalerweise die Basisklassen, die
benötigt werden, um Erweiterungen zu erlauben, mit denen, sofern
erforderlich, spezifische Unterklassenstrukturen oder Klassifikations-
schemen hinzugefügt werden können.
• In solchen Fällen werden Wiederverwender dazu ermutigt,
Anwendungsprofile einer speziellen Anwendungsdomain zu
definieren, indem sie (sofern erforderlich) Unterklassen,
Untereigenschaften und kontrollierte Vokabulare spezifizieren.
• Zum Beispiel:
DCAT Anwendungsprofil für Datenportale in Europa
Registered Organization Vokabular als Anwendungsprofil der
Organisations-Ontologie.
Folie 12
Siehe auch:
joinup.ec.europa.eu/asset/dcat_application_profile/home
13. DATASUPPORTOPEN
Vorteile der Weiterverwendung
• Weiterverwendung fördert die Interoperabilität Ihrer Daten in
hohem Maße.
Beispielsweise bewirkt die Verwendung von <dcterms:created>, dessen Wert ein
Datumsformat vom Typ 2013-02-21^^xsd:date sein sollte, dass die Daten sofort von
vielen Maschinen verarbeitbar sind. Wenn Ihr Schema Datenherausgeber dazu
zwingt ein abweichendes Format für Bezeichnungen und das Datum, wie ex:date "21
February 2013“ zu benutzen, dann ist für veröffentlichte Daten, bei denen Ihr Schema
genutzt wird, eine weitere Verarbeitung erforderlich um sie anderen Daten
anzugleichen.
• Weiterverwendung erhöht die Glaubwürdigkeit Ihres Schemas.
Es zeigt, dass es mit genügend Sorgfalt und Professionalität veröffentlicht worden ist,
was die Weiterverwendung weiter fördert.
• Weiterverwendung ist einfacher und billiger.
Durch die Weiterverwendung von Klassen und Eigenschaften gut definierter und
richtig gehosteter Vokabeln vermeiden Sie, dass Sie die Bemühung ihrer Erstellung
wiederholen müssen.
Folie 13
15. DATASUPPORTOPEN
Erstellen Sie Unterklassen und
Untereigenschaften
• RDF-Schemata und Vokabulare enthalten oft Begriffe, die sehr
generisch sind.
• Durch die Erstellung von Unterklassen- und Untereigenschafts-
beziehungen können Systeme, die die übergeordnete Eigenschaft
oder Klasse verstehen, in der Lage sein, die Daten zu interpretieren;
selbst wenn die spezifischeren Begriffe unbekannt sind.
• Vermeiden Sie es, Unterklassen und Untereigenschaften aus
dem einzigen Grund zu erstellen, damit Sie Ihren eigenen
Begriff verwenden können, um etwas zu beschreiben, was
bereits existiert.
Folie 15
3
16. DATASUPPORTOPEN
Erstellung von Untereigenschaften - Beispiel
Das Registered Organization Vokabular definiert drei Untereigenschaften von
„org:classification“: ‚companyType‘, ‚companyStatus‘ und ‚companyActivity‘.
Folie 16
17. DATASUPPORTOPEN
Eine Untereigenschaft in RDF definieren
<rdf:Property rdf:about="rov:companyType">
<rdfs:label xml:lang="en">company type</rdfs:label>
<rdfs:comment xml:lang="en" rdf:parseType="Literal">
This property records the type of company. Familiar types are SA, PLC, LLC,
GmbH etc. Each jurisdiction will have a limited set of recognised company
types and these should be used in a consistent manner using a skos:Concept
as described in the <a href="#skos:Concept">Code</a> Class.
</rdfs:comment>
<rdfs:isDefinedBy rdf:resource="http://www.w3.org/ns/regorg#"/>
<rdfs:range rdf:resource="skos:Concept"/>
<rdfs:subPropertyOf rdf:resource="org:classification" />
<dcterms:identifier>legal:companyType</dcterms:identifier>
</rdf:Property>
Folie 17
18. DATASUPPORTOPEN
Wenn neue Begriffe erforderlich sind, erstellen Sie
sie gemäß allgemein anerkannter Best-Practices.
Klassen beginnen mit einem Großbuchstaben und sind immer
Singular, z.B. skos:Concept.
Eigenschaften beginnen mit einem Kleinbuchstaben, z.B. rdfs:label.
Objekteigenschaften sollten Verben sein, z.B. org:hasSite.
Datentypeigenschaften sollten Substantive sein, z.B.
dcterms:description.
Verwenden Sie Großbuchstaben, wenn ein Begriff aus mehr als
einem Wort besteht, z.B. foaf:isPrimaryTopicOf.
Folie 18
4
19. DATASUPPORTOPEN
Definieren einer neuen Klasse - Organisation
<rdf:RDF
xmlns:rdfs=“http://www.w3.org/2000/01/rdf-schema#”
xmlns:org=“htpp://example.org/organisation-schema”>
<rdf:Class rdf:about=“org:Organisation">
<rdfs:label xml:lang="en">Organisation</rdfs:label>
<rdfs:comment xml:lang:”en”>
Legal entity that is registered in an official national or regional
register.
</rdfs:comment>
</rdf:Class>
Folie 19
20. DATASUPPORTOPEN
Definieren einer neuen Eigenschaft - registrationNumber
<rdf:RDF
xmlns:rdfs=“http://www.w3.org/2000/01/rdf-schema#”
xmlns:org=“htpp://example.org/organisation-schema”>
<rdf:Property rdf:about=“org:registrationNumber">
<rdfs:label xml:lang="en">registrationNumber</rdfs:label>
<rdfs:comment xml:lang:”en”>
The number that a registered organisation receives upon registration
in the official register.
</rdfs:comment>
</rdf:Class>
Folie 20
21. DATASUPPORTOPEN
Definieren von Domain- und Bereichsbeschränkungen
<rdf:RDF
xmlns:rdfs=“http://www.w3.org/2000/01/rdf-schema#”
xmlns:org=“htpp://example.org/organisation-schema”
xmlns:locn=“http://www.w3.org/ns/locn#”>
<rdf:Property rdf:about=“org:isLocated">
<rdfs:label xml:lang="en">isLocated</rdfs:label>
<rdfs:comment xml:lang:”en”>
The official address of the registered organisation’s headquarters.
</rdfs:comment>
<rdfs:domain rdf:resource=“org:Organisation”/>
<rdfs:range rdf:resource=“locn:Address”>
</rdf:Class>
Folie 21
http://example.org/org/1234 org:isLocated http://dbpedia.org/page/Brussels
22. DATASUPPORTOPEN
Veröffentlichen Sie Ihre Daten innerhalb einer sehr stabilen
Umgebung, die erstellt wurde um persistent zu sein
• Wählen Sie einen stabilen Namensraum für Ihr RDF-Schema (z.B.
W3C, Purl...)
• Folgen Sie Good Practices bei der Veröffentlichung von persistenten
Uniform Resource Identifier (URI) Sets, sowohl in Bezug auf das
Format als auch auf Entwurfsregeln und Verwaltung.
• Beispiele:
http://www.w3.org/ns/adms
http://purl.org/dc/elements/1.1
Folie 22
5
Siehe auch:
https://joinup.ec.europa.eu/community/semic/document/cookbook-translating-
data-models-rdf-schemas
http://www.slideshare.net/OpenDataSupport/design-and-manage-persitent-uris
23. DATASUPPORTOPEN
Publizieren Sie das RDF-Schema, indem sie es
auf relevanten Services registrieren
Sobald Ihr RDF-Schema veröffentlicht wurde, werden Sie wollen, dass die
Leute es kennenlernen. Um ein breiteres Publikum zu erreichen, registrieren
Sie es auf Joinup und Linked Open Vocabularies.
Folie 23
6
Refinethesearch results via the
facetedsearch filters.
2
1
3
http://joinup.ec.europa.eu
http://lov.okfn.org
24. DATASUPPORTOPEN
Schlussfolgerungen
Folie 24
Beginnen Sie mit einem robusten Domainmodell, das nach einem
strukturierten Prozess und Methodik entwickelt wurde.
Recherchieren Sie vorhandene Begriffe sowie deren Nutzung und
maximieren Sie die Wiederverwendung dieser Begriffe.
Dort, wo neue Begriffe als Spezialisierungen von vorhandenen Begriffen
betrachten werden können, erstellen Sie Unterklassen und Untereigenschaften.
Wenn neue Begriffe erforderlich sind, erstellen Sie sie gemäß
allgemein anerkannter Best-Practices.
Veröffentlichen Sie Ihre Daten innerhalb einer sehr stabilen
Umgebung, die erstellt wurde um persistent zu sein.
Publizieren Sie das RDF-Schema, indem sie es auf relevanten Services
registrieren.
Analysieren
Modellieren
Veröffentlichen
25. DATASUPPORTOPEN
Gruppenübung
Folie 25
Erstellen Sie in Zweiergruppen die RDF Beschreibung für ein
Vokabular, das einen Bürger darstellt.
Was sind, Ihrer Meinung nach, die größten Hindernisse für die
Weiterverwendung vorhandener RDF-Vokabulare?
http://www.visualpharm.com
http://www.visualpharm.com
Machen Sie auch den Online-Test!
27. DATASUPPORTOPEN
Referenzen
Folie 9:
• Linked Data Cookbook. W3C.
http://www.w3.org/2011/gld/wiki/Linked_Data_Cookbook
Folie 10-23:
• ISA Programme. Cookbook for translating Data Models to RDF Schemas.
https://joinup.ec.europa.eu/community/semic/document/cookbook-translating-
data-models-rdf-schemas
Folie 16, 18-21:
• W3C. An organization ontology. http://www.w3.org/TR/vocab-org/
Folie 23:
• ADMS Brochure. ISA Programme.
https://joinup.ec.europa.eu/elibrary/document/adms-brochure
Folie 27
28. DATASUPPORTOPEN
Weiterführende Literatur
Linked Data Cookbook, W3C Government Linked Data Working
Group,
http://www.w3.org/2011/gld/wiki/Linked_Data_Cookbook
EC, ISA Process and methodology for developing semantic
agreements,
https://joinup.ec.europa.eu/community/core_vocabularies/documen
t/process-and-methodology-developing-semantic-agreements
EC ISA, Cookbook for translating Data Models to RDF Schemas
https://joinup.ec.europa.eu/community/semic/document/cookbook-
translating-data-models-rdf-schemas
Folie 28
29. DATASUPPORTOPEN
Verwandte Projekte und Initiativen
Joinup, http://joinup.ec.europa.eu
Linked Open Vocabularies (LOV), http://lov.okfn.org/
EC ISA, e-Government Core Vocabularies,
https://joinup.ec.europa.eu/community/core_vocabularies/home
W3C Schools – Learn RDF
http://www.w3schools.com/rdf/default.asp
EUCLID, http://euclid-project.eu/
XML Summer School http://xmlsummerschool.com/
Folie 29
30. DATASUPPORTOPEN
Werden Sie Teil unseres Teams...
Folie 30
Besuchen Sie
uns
Kontaktieren Sie
uns
Lernen Sie uns
kennen
Folgen Sie uns
Open Data Support
http://www.slideshare.net/OpenDataSupport
http://www.opendatasupport.eu
Open Data Support
http://goo.gl/y9ZZI
@OpenDataSupport contact@opendatasupport.eu