SlideShare uma empresa Scribd logo
1 de 52
Universität zu Köln. Historisch-Kulturwissenschaftliche Informationsverarbeitung
Dr. Jan G. Wieners // jan.wieners@uni-koeln.de
Basisinformationstechnologie II
Sommersemester 2015
29. April 2015 – Semantic Web
Ausgangspunkt: Das World Wide Web (WWW)
 Einschränkungen des WWW
Semantic Web
 Problemstellung, Intention, Worum geht‘s?
 Wissensrepräsentation
 Mikroformate
 RDF, RDF / XML
 (Ontologien)
 Anwendung: FOAF
Sitzungsüberblick
World Wide Web
Tim Berners-Lee(*1955, London)
Vannevar Bush(1890-1974)
„Magic“:
 Rechtschreibfehler:
„accidentally“
vs. „acidentally“
It‘s magic?
„Magic“ II:
 Ranking: Sortierung der Treffer von hochrelevanten zu
weniger relevanten Treffern
„Magic“ III:
 Performance:
It‘s magic?
„What‘s wrong with the web?“ – die Grenzen des
WWW
I. „Wer ist Jan Wieners?“
 Suchanfrage: Wieners
 [Wer], [ist] weniger relevante Suchterme
World Wide Web
„What‘s wrong with the web?“ – die Grenzen des
WWW
 II. „Zeige mir Fotos von Paris“
 Suchmaschinen versuchen (mitunter), die
Bedeutung eines Bildes / das im Bild dargestellt
durch den Kontext zu erschließen:
 Dateiname
 Text, der sich in Bildnähe befindet
„What‘s wrong with the
web?“ – die Grenzen
des WWW
 III. „Finde Musik, die
ich mögen könnte“
 Knackpunkt:
Hintergrundwissen –
Welche Musik mag ich
derzeit?
(Musikgeschmack
verändert sich mitunter)
World Wide Web
Oh weh, was
meint sie / er
damit bloß???
Knackpunkt: Den Computermechanismen
mangelt‘s an Wissen!
„knowledge gap“:
 Probleme im Verständnis natürlicher
Sprache
 Interpretation des Inhaltes von Bildern
oder anderen multimedialen Dingen
 Computer verfügt nicht über
Hintergrundwissen über das der
Benutzer / die Benutzerin verfügt
 Computer verfügt nicht über
Hintergrundwissen über die Benutzerin /
den Benutzer
Semantic Web
Ach so ist das gemeint!
…hätte sie / er das nicht
gleich sagen können?!?
ToDo: Wissenslücke
zwischen Benutzer und
Computer mindern
 Bereitstellung von
Wissen in einer Art und
Weise, in der es von
Computern verarbeitet
werden und für weiteres
Schließen verwendet
werden kann
 Z.B.: Bereitstellung von
(semantischen)
Metainformationen, die
die Inhalte der Website
beschreiben (description,
keywords, etc.)
Bild + Metadaten
 Schlüsselwörter
 Georeferenzierung
◦ Adresskodierung (Postanschrift)
◦ Zuweisung von Koordinaten (Geotagging)
◦ …
 Konzept des Semantic Web formuliert 1996 von
Tim Berners-Lee
 Kerntechnologien (logikbasierte Sprachen zur
Representation von Wissen und (automatisiertem)
Schließen) entwickelt im Forschungsfeld der
Künstlichen Intelligenz.
 Standards: W3C
 Ursprüngliche Intention: Annotation –
Anreicherung der Inhalte im WWW durch
Metadaten
Semantic Web
Menschliches Denken Rationales Denken
„[Die Automatisierung von]
Aktivitäten, die wir dem
menschlichen Denken
zuordnen, Aktivitäten wie
beispielsweise
Entscheidungsfindung,
Problemlösung, Lernen.“
(Bellman, 1978)
„Die Studie mentaler
Fähigkeiten durch die
Nutzung
programmiertechnischer
Modelle.“
(Charniak und
McDermott,1985)
Menschliches Handeln Rationales Handeln
„Das Studium des
Problems, Computer dazu
zu bringen, Dinge zu tun,
bei denen ihnen
momentan der Mensch
noch überlegen ist.“
(Rich und Knight, 1991)
„Computerintelligenz ist die
Studie des Entwurfs
intelligenter Agenten.“
(Poole et al., 1998)
Fokussierungsweisen von KI nach Russell / Norvig
Semantic Web I:
Semantische Annotation
durch Mikroformate
„Designed for humans first and machines second,
microformats are a set of simple, open data formats
built upon existing and widely adopted standards.”
(http://microformats.org/)
Mikroformate
Beispiel: Mikroformat „hCard“ (vgl. http://de.wikipedia.org/wiki/Mikroformate):
XHTML / HTML, einfach:
<div>
<div>Max Mustermann</div>
<div>Musterfirma</div
<div>01234/56789</div>
<a
href="http://example.com/">http://example.com/</a>
</div>
Semantic Web
Beispiel: Mikroformat „hCard“ (vgl. http://de.wikipedia.org/wiki/Mikroformate):
XHTML, einfach:
<div>
<div>Max Mustermann</div>
<div>Musterfirma</div
<div>01234/56789</div>
<a href="http://example.com/">http://example.com/</a>
</div>
Im Mikroformat „hCard“:
<div class="vcard">
<div class="fn">Max Mustermann</div>
<div class="org">Musterfirma</div>
<div class="tel">01234/56789</div>
<a class="url"
href="http://example.com/">http://example.com/</a>
</div>
Semantic Web
Semantic Web II:
Das Resource Description
Framework (RDF)
http://www.w3schools.com/webservices/ws_rdf_intro.asp
 Extensible Markup Language (XML)
 „Wohlgeformtheit“?
 Gültigkeit (Validität)?
 DTD?
 XML Schema? Schematron? RELAX NG?
XML?
Natürlichsprachige Aussage:
Die Webseite „http://www.example.org“ hat einen Urheber namens Jan
Wieners.
Die Aussage besteht aus dem Gegenstand der Aussage,
einer Eigenschaft des Gegenstandes und einem Wert für diese
Eigenschaft.
In RDF Terminologie wird der Gegenstand der Aussage als Subjekt (subject),
die Eigenschaft als Prädikat (predicate) und Wert der Eigenschaft als
Objekt (object) bezeichnet.
 Subjekt, Prädikat und Objekt bilden ein Tripel.
RDF Grundkonzepte
Ein oder mehrere Tripel bilden einen RDF-
Graphen:
RDF (Graphen)modell
Subject A Object A
Predicate A
Object B
Predicate B
 Bestandteile der Aussage getrennt von
Leerzeichen
 URI in spitzen Klammern
 Eigenschaftswerte in Anführungszeichen
 Standardnotationsformate: N-Triple, Turtle, etc.
„Das HTML-Dokument index.html wurde von Jan
Wieners erstellt“:
ex:index.html dc:creator “Jan Wieners“
N-Tripel Notation
Namespaces / Namensräume
 Klassen und Eigenschaften unterhalb des
gleichen URI bilden einen Namespace.
Beispiel: Dublin Core
 http://purl.org/dc/elements/1.1/title
 http://purl.org/dc/elements/1.1/creator
 http://purl.org/dc/elements/1.1/date
FOAF
 http://xmlns.com/foaf/0.1
RDF
Intention:
 Globaler, eindeutiger Bezeichner für Entitäten
 Unterklassen: URL, URN
Beispiele:
 http://de.wikipedia.org/wiki/Uniform_Resource_Ide
ntifier
 urn:isbn:4-7980-1224-6
Uniform Resource Identifier (URI)
<?xml version="1.0"?>
<RDF>
<Description
about="http://www.hki.uni-koeln.de/wieners">
<author>Jan Wieners</author>
<homepage>
http://www.hki.uni-koeln.de
</homepage>
</Description>
</RDF>
RDF (reduziert, ohne Namensräume)
Ressource (resource)
 Worum geht‘s?
<?xml version="1.0"?>
<RDF>
<Description
about="http://www.hki.uni-koeln.de/wieners">
<author>Jan Wieners</author>
<homepage>
http://www.hki.uni-koeln.de
</homepage>
</Description>
</RDF>
RDF (reduziert, ohne Namensräume)
Ressource (resource)
 Worum geht‘s?
Eigenschaft (property)
<?xml version="1.0"?>
<RDF>
<Description
about="http://www.hki.uni-koeln.de/wieners">
<author>Jan Wieners</author>
<homepage>
http://www.hki.uni-koeln.de
</homepage>
</Description>
</RDF>
RDF (reduziert, ohne Namensräume)
Ressource (resource)
 Worum geht‘s?
Eigenschaft (property)
Eigenschaftswert (property value)
<?xml version="1.0"?>
<RDF>
<Description
about="http://www.hki.uni-koeln.de/wieners">
<author>Jan Wieners</author>
<homepage>
http://www.hki.uni-koeln.de
</homepage>
</Description>
</RDF>
RDF (reduziert, ohne Namensräume)
Ressource (resource)
 Worum geht‘s?
Eigenschaft (property)
Eigenschaftswert (property value)
RDF-Statement = Ressource + Eigenschaft +
Eigenschaftswert
„Jan Wieners ist der Autor von http://www.hki.uni-
koeln.de/wieners“
RDF (mit Namensräumen)
<?xml version="1.0"?>
<rdf:RDF
xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#"
xmlns:hki="http://www.hki.uni-koeln.de">
<rdf:Description rdf:about="http://www.hki.uni-
koeln.de/ITZert">
<hki:author>Jan Wieners</hki:author>
<hki:homepage>http://www.hki.uni-
koeln.de/wieners</hki:homepage>
</rdf:Description>
</rdf:RDF>
RDF/XML, Praxisbeispiel:
Friend of a Friend (FOAF)
„The FOAF ("Friend of a Friend") project is a
community driven effort to define an RDF
vocabulary for expressing metadata about people,
and their interests, relationships and activities.”
Grundaufbau eines FOAF-Dokumentes:
RDF / XML und FOAF
<?xml version="1.0"?>
<rdf:RDF xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#"
xmlns:rdfs="http://www.w3.org/2000/01/rdf-schema#"
xmlns:foaf="http://xmlns.com/foaf/0.1/">
<!– Hier kommt das FOAF-XML rein -->
</rdf:RDF>
Hinzufügen einer Person und eines Namens:
RDF / XML und FOAF
<?xml version="1.0"?>
<rdf:RDF xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#"
xmlns:rdfs="http://www.w3.org/2000/01/rdf-schema#"
xmlns:foaf="http://xmlns.com/foaf/0.1/">
<foaf:Person>
<foaf:name>Jan Wieners</foaf:name>
</foaf:Person>
</rdf:RDF>
Hinzufügen einer Email-Adresse:
RDF / XML und FOAF
<?xml version="1.0"?>
<rdf:RDF xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#"
xmlns:rdfs="http://www.w3.org/2000/01/rdf-schema#"
xmlns:foaf="http://xmlns.com/foaf/0.1/">
<foaf:Person>
<foaf:name>Jan Wieners</foaf:name>
<foaf:mbox rdf:resource="mailto:jan.wieners@uni-koeln.de"/>
</foaf:Person>
</rdf:RDF>
Relationen zu anderen Personen ergänzen:
<?xml version="1.0"?>
<rdf:RDF xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#"
xmlns:rdfs="http://www.w3.org/2000/01/rdf-schema#"
xmlns:foaf="http://xmlns.com/foaf/0.1/">
<foaf:Person>
<foaf:name>Jan Wieners</foaf:name>
<foaf:mbox rdf:resource="mailto:jan.wieners@uni-koeln.de"/>
</foaf:Person>
<foaf:Person rdf:nodeID="Joyce">
<foaf:name>James Joyce</foaf:name>
<rdfs:seeAlso rdf:resource="http://www.example.com/jamesjoyce.rdf"/>
</foaf:Person>
<foaf:Person rdf:nodeID="Jan">
<foaf:name>Jan Wieners</foaf:name>
<foaf:knows rdf:nodeID="Joyce"/>
<foaf:knows>
<foaf:Person rdf:nodeID="Murakami">
<foaf:name>Haruki Murakami</foaf:name>
</foaf:Person>
</foaf:knows>
</foaf:Person>
</rdf:RDF>
SPARQL – SPARQL Protocol And RDF Query Language
Ein Beispiel(vgl. http://de.wikipedia.org/wiki/SPARQL):
PREFIX abc: <http://example.com/exampleOntology#>
SELECT ?capital ?country
WHERE {
?x abc:cityname ?capital;
abc:isCapitalOf ?y .
?y abc:countryname ?country ;
abc:isInContinent abc:Africa .
}
Abfrage von Informationen
/
 http://de.wikipedia.org/wiki/Tim_Berners-
Lee#/media/File:Sir_Tim_Berners-Lee.jpg (Paul
Clarke)
Bildnachweise

Mais conteúdo relacionado

Destaque

Cap1
Cap1Cap1
Cap1CJAO
 
Vortrag "Humanethologie goes Business" in Wien Geburtstag Prof. Dr. Karl Grammer
Vortrag "Humanethologie goes Business" in Wien Geburtstag Prof. Dr. Karl GrammerVortrag "Humanethologie goes Business" in Wien Geburtstag Prof. Dr. Karl Grammer
Vortrag "Humanethologie goes Business" in Wien Geburtstag Prof. Dr. Karl GrammerBarbara Niedner
 
Cap4
Cap4Cap4
Cap4CJAO
 
Hhkgphanthietdien
HhkgphanthietdienHhkgphanthietdien
Hhkgphanthietdienvodkato
 
Gymnasium bildungsplan gesamt
Gymnasium bildungsplan gesamtGymnasium bildungsplan gesamt
Gymnasium bildungsplan gesamtMirko
 
Enterprise mashups - Remix the Web. Create your own workplace.
Enterprise mashups - Remix the Web. Create your own workplace.Enterprise mashups - Remix the Web. Create your own workplace.
Enterprise mashups - Remix the Web. Create your own workplace.tischmid
 

Destaque (12)

Cap1
Cap1Cap1
Cap1
 
Vortrag "Humanethologie goes Business" in Wien Geburtstag Prof. Dr. Karl Grammer
Vortrag "Humanethologie goes Business" in Wien Geburtstag Prof. Dr. Karl GrammerVortrag "Humanethologie goes Business" in Wien Geburtstag Prof. Dr. Karl Grammer
Vortrag "Humanethologie goes Business" in Wien Geburtstag Prof. Dr. Karl Grammer
 
Cap4
Cap4Cap4
Cap4
 
Jugendschutz
JugendschutzJugendschutz
Jugendschutz
 
Seguridad de contenidos, Foro FAST, 2006
Seguridad de contenidos, Foro FAST, 2006Seguridad de contenidos, Foro FAST, 2006
Seguridad de contenidos, Foro FAST, 2006
 
Hhkgphanthietdien
HhkgphanthietdienHhkgphanthietdien
Hhkgphanthietdien
 
PR-Trends 2008
PR-Trends 2008PR-Trends 2008
PR-Trends 2008
 
BIT I WiSe 2014 | Basisinformationstechnologie I - 10: Programmiersprachen III
BIT I WiSe 2014 | Basisinformationstechnologie I - 10: Programmiersprachen IIIBIT I WiSe 2014 | Basisinformationstechnologie I - 10: Programmiersprachen III
BIT I WiSe 2014 | Basisinformationstechnologie I - 10: Programmiersprachen III
 
Diseño de Juego
Diseño de JuegoDiseño de Juego
Diseño de Juego
 
Gymnasium bildungsplan gesamt
Gymnasium bildungsplan gesamtGymnasium bildungsplan gesamt
Gymnasium bildungsplan gesamt
 
Enterprise mashups - Remix the Web. Create your own workplace.
Enterprise mashups - Remix the Web. Create your own workplace.Enterprise mashups - Remix the Web. Create your own workplace.
Enterprise mashups - Remix the Web. Create your own workplace.
 
ASP.NET MVC a TDD
ASP.NET MVC a TDDASP.NET MVC a TDD
ASP.NET MVC a TDD
 

Semelhante a BIT I SoSem 2015 | Basisinformationstechnologie II - 03_Semantic Web

Einführung in das Semantic Web
Einführung in das Semantic WebEinführung in das Semantic Web
Einführung in das Semantic WebJakob .
 
Auf Du und Du mit Dublin Core & Co. - Berufsfeld Metadaten-Management im Kont...
Auf Du und Du mit Dublin Core & Co. - Berufsfeld Metadaten-Management im Kont...Auf Du und Du mit Dublin Core & Co. - Berufsfeld Metadaten-Management im Kont...
Auf Du und Du mit Dublin Core & Co. - Berufsfeld Metadaten-Management im Kont...suvanni
 
Semantic MediaWiki im Projektmanagement
Semantic MediaWiki im Projektmanagement Semantic MediaWiki im Projektmanagement
Semantic MediaWiki im Projektmanagement Bernhard Krabina
 
Wissensrepräsentation im Social Semantic Web
Wissensrepräsentation im Social Semantic WebWissensrepräsentation im Social Semantic Web
Wissensrepräsentation im Social Semantic WebKatrin Weller
 
Einführung in die semantische Suche in Massendaten
Einführung in die semantische Suche in MassendatenEinführung in die semantische Suche in Massendaten
Einführung in die semantische Suche in MassendatenMartin Voigt
 
Linked Open Data in der Bibliothekswelt
Linked Open Data in der BibliotheksweltLinked Open Data in der Bibliothekswelt
Linked Open Data in der BibliotheksweltAdrian Pohl
 
20080822barcamp Traunkirchen
20080822barcamp Traunkirchen20080822barcamp Traunkirchen
20080822barcamp TraunkirchenAndreas Blumauer
 
Human-in-the-Loop: das Web als Grundlage interdisziplinärer Data Science Meth...
Human-in-the-Loop: das Web als Grundlage interdisziplinärer Data Science Meth...Human-in-the-Loop: das Web als Grundlage interdisziplinärer Data Science Meth...
Human-in-the-Loop: das Web als Grundlage interdisziplinärer Data Science Meth...Stefan Dietze
 
Linked Data - Das Ende des Dokuments?
Linked Data - Das Ende des Dokuments?Linked Data - Das Ende des Dokuments?
Linked Data - Das Ende des Dokuments?Semantic Web Company
 
Normdaten - die Aggregatoren im Web
Normdaten - die Aggregatoren im WebNormdaten - die Aggregatoren im Web
Normdaten - die Aggregatoren im WebAlexander Haffner
 
Web-2.0-Forschung der KWARC-Gruppe
Web-2.0-Forschung der KWARC-GruppeWeb-2.0-Forschung der KWARC-Gruppe
Web-2.0-Forschung der KWARC-GruppeChristoph Lange
 
Web 20-einfuehrung-2011
Web 20-einfuehrung-2011Web 20-einfuehrung-2011
Web 20-einfuehrung-2011rheinturm
 

Semelhante a BIT I SoSem 2015 | Basisinformationstechnologie II - 03_Semantic Web (20)

Einführung in das Semantic Web
Einführung in das Semantic WebEinführung in das Semantic Web
Einführung in das Semantic Web
 
Überblick Semantic Web
Überblick Semantic WebÜberblick Semantic Web
Überblick Semantic Web
 
Auf Du und Du mit Dublin Core & Co. - Berufsfeld Metadaten-Management im Kont...
Auf Du und Du mit Dublin Core & Co. - Berufsfeld Metadaten-Management im Kont...Auf Du und Du mit Dublin Core & Co. - Berufsfeld Metadaten-Management im Kont...
Auf Du und Du mit Dublin Core & Co. - Berufsfeld Metadaten-Management im Kont...
 
Bit SoSem 2014 | Basisinformationstechnologie I - 04: Text
Bit SoSem 2014 | Basisinformationstechnologie I - 04: TextBit SoSem 2014 | Basisinformationstechnologie I - 04: Text
Bit SoSem 2014 | Basisinformationstechnologie I - 04: Text
 
Semantic MediaWiki im Projektmanagement
Semantic MediaWiki im Projektmanagement Semantic MediaWiki im Projektmanagement
Semantic MediaWiki im Projektmanagement
 
1 - Einfuehrung
1 - Einfuehrung1 - Einfuehrung
1 - Einfuehrung
 
Semantisches Web
Semantisches WebSemantisches Web
Semantisches Web
 
Wissensrepräsentation im Social Semantic Web
Wissensrepräsentation im Social Semantic WebWissensrepräsentation im Social Semantic Web
Wissensrepräsentation im Social Semantic Web
 
BIT I SoSem 2015 | Basisinformationstechnologie II - 04_Text
BIT I SoSem 2015 | Basisinformationstechnologie II - 04_TextBIT I SoSem 2015 | Basisinformationstechnologie II - 04_Text
BIT I SoSem 2015 | Basisinformationstechnologie II - 04_Text
 
WiSe 2013 | IT-Zertifikat: AMM - Semantic Web II: RDF und FOAF
WiSe 2013 | IT-Zertifikat: AMM - Semantic Web II: RDF und FOAFWiSe 2013 | IT-Zertifikat: AMM - Semantic Web II: RDF und FOAF
WiSe 2013 | IT-Zertifikat: AMM - Semantic Web II: RDF und FOAF
 
Einführung in die semantische Suche in Massendaten
Einführung in die semantische Suche in MassendatenEinführung in die semantische Suche in Massendaten
Einführung in die semantische Suche in Massendaten
 
Linked Open Data in der Bibliothekswelt
Linked Open Data in der BibliotheksweltLinked Open Data in der Bibliothekswelt
Linked Open Data in der Bibliothekswelt
 
Microformats & COinS
Microformats & COinSMicroformats & COinS
Microformats & COinS
 
Web 3.0
Web 3.0Web 3.0
Web 3.0
 
20080822barcamp Traunkirchen
20080822barcamp Traunkirchen20080822barcamp Traunkirchen
20080822barcamp Traunkirchen
 
Human-in-the-Loop: das Web als Grundlage interdisziplinärer Data Science Meth...
Human-in-the-Loop: das Web als Grundlage interdisziplinärer Data Science Meth...Human-in-the-Loop: das Web als Grundlage interdisziplinärer Data Science Meth...
Human-in-the-Loop: das Web als Grundlage interdisziplinärer Data Science Meth...
 
Linked Data - Das Ende des Dokuments?
Linked Data - Das Ende des Dokuments?Linked Data - Das Ende des Dokuments?
Linked Data - Das Ende des Dokuments?
 
Normdaten - die Aggregatoren im Web
Normdaten - die Aggregatoren im WebNormdaten - die Aggregatoren im Web
Normdaten - die Aggregatoren im Web
 
Web-2.0-Forschung der KWARC-Gruppe
Web-2.0-Forschung der KWARC-GruppeWeb-2.0-Forschung der KWARC-Gruppe
Web-2.0-Forschung der KWARC-Gruppe
 
Web 20-einfuehrung-2011
Web 20-einfuehrung-2011Web 20-einfuehrung-2011
Web 20-einfuehrung-2011
 

Mais de Institute for Digital Humanities, University of Cologne

Mais de Institute for Digital Humanities, University of Cologne (20)

Künstliche Intelligenz und visuelle Erzählungen: Comicanalyse | 17.04.2019 | ...
Künstliche Intelligenz und visuelle Erzählungen: Comicanalyse | 17.04.2019 | ...Künstliche Intelligenz und visuelle Erzählungen: Comicanalyse | 17.04.2019 | ...
Künstliche Intelligenz und visuelle Erzählungen: Comicanalyse | 17.04.2019 | ...
 
Augmented City –Street Art, Embodiment, Cultural Heritage & AR | 03.04.2019 |...
Augmented City –Street Art, Embodiment, Cultural Heritage & AR | 03.04.2019 |...Augmented City –Street Art, Embodiment, Cultural Heritage & AR | 03.04.2019 |...
Augmented City –Street Art, Embodiment, Cultural Heritage & AR | 03.04.2019 |...
 
Künstliche Intelligenz und visuelle Erzählungen: Comicanalyse | 03.04.2019 | ...
Künstliche Intelligenz und visuelle Erzählungen: Comicanalyse | 03.04.2019 | ...Künstliche Intelligenz und visuelle Erzählungen: Comicanalyse | 03.04.2019 | ...
Künstliche Intelligenz und visuelle Erzählungen: Comicanalyse | 03.04.2019 | ...
 
Transformation mittelhochdeutscher Erfahrungswelten – vom Text zum Computerga...
Transformation mittelhochdeutscher Erfahrungswelten – vom Text zum Computerga...Transformation mittelhochdeutscher Erfahrungswelten – vom Text zum Computerga...
Transformation mittelhochdeutscher Erfahrungswelten – vom Text zum Computerga...
 
Transformation mittelhochdeutscher Erfahrungswelten – vom Text zum Computerga...
Transformation mittelhochdeutscher Erfahrungswelten – vom Text zum Computerga...Transformation mittelhochdeutscher Erfahrungswelten – vom Text zum Computerga...
Transformation mittelhochdeutscher Erfahrungswelten – vom Text zum Computerga...
 
Bit sosem 2016-wieners-sitzung-13_ki-in-games
Bit sosem 2016-wieners-sitzung-13_ki-in-gamesBit sosem 2016-wieners-sitzung-13_ki-in-games
Bit sosem 2016-wieners-sitzung-13_ki-in-games
 
Bit sosem 2016-wieners-sitzung-12_bild-iv-computer-vision
Bit sosem 2016-wieners-sitzung-12_bild-iv-computer-visionBit sosem 2016-wieners-sitzung-12_bild-iv-computer-vision
Bit sosem 2016-wieners-sitzung-12_bild-iv-computer-vision
 
Bit sosem 2016-wieners-sitzung-11_bild-iii-filter
Bit sosem 2016-wieners-sitzung-11_bild-iii-filterBit sosem 2016-wieners-sitzung-11_bild-iii-filter
Bit sosem 2016-wieners-sitzung-11_bild-iii-filter
 
Bit sosem 2016-wieners-sitzung-10_bild-ii-punktoperationen
Bit sosem 2016-wieners-sitzung-10_bild-ii-punktoperationenBit sosem 2016-wieners-sitzung-10_bild-ii-punktoperationen
Bit sosem 2016-wieners-sitzung-10_bild-ii-punktoperationen
 
Bit sosem 2016-wieners-sitzung-09_bild-i-kompression
Bit sosem 2016-wieners-sitzung-09_bild-i-kompressionBit sosem 2016-wieners-sitzung-09_bild-i-kompression
Bit sosem 2016-wieners-sitzung-09_bild-i-kompression
 
Bit sosem 2016-wieners-sitzung-07_rechnerkommunikation-ii
Bit sosem 2016-wieners-sitzung-07_rechnerkommunikation-iiBit sosem 2016-wieners-sitzung-07_rechnerkommunikation-ii
Bit sosem 2016-wieners-sitzung-07_rechnerkommunikation-ii
 
Bit sosem 2016-wieners-sitzung-06_rechnerkommunikation
Bit sosem 2016-wieners-sitzung-06_rechnerkommunikationBit sosem 2016-wieners-sitzung-06_rechnerkommunikation
Bit sosem 2016-wieners-sitzung-06_rechnerkommunikation
 
Bit sosem 2016-wieners-sitzung-05_zellulaere-automaten-conway
Bit sosem 2016-wieners-sitzung-05_zellulaere-automaten-conwayBit sosem 2016-wieners-sitzung-05_zellulaere-automaten-conway
Bit sosem 2016-wieners-sitzung-05_zellulaere-automaten-conway
 
Bit sosem 2016-wieners-sitzung-04_theoretische-informatik
Bit sosem 2016-wieners-sitzung-04_theoretische-informatikBit sosem 2016-wieners-sitzung-04_theoretische-informatik
Bit sosem 2016-wieners-sitzung-04_theoretische-informatik
 
Bit sosem 2016-wieners-sitzung-03_algorithmen
Bit sosem 2016-wieners-sitzung-03_algorithmenBit sosem 2016-wieners-sitzung-03_algorithmen
Bit sosem 2016-wieners-sitzung-03_algorithmen
 
Bit sosem 2016-wieners-sitzung-02_datenstrukturen
Bit sosem 2016-wieners-sitzung-02_datenstrukturenBit sosem 2016-wieners-sitzung-02_datenstrukturen
Bit sosem 2016-wieners-sitzung-02_datenstrukturen
 
Bit sosem 2016-wieners-sitzung-01_auffrischung
Bit sosem 2016-wieners-sitzung-01_auffrischungBit sosem 2016-wieners-sitzung-01_auffrischung
Bit sosem 2016-wieners-sitzung-01_auffrischung
 
Bit sosem 2016-wieners-sitzung-00_themenueberblick
Bit sosem 2016-wieners-sitzung-00_themenueberblickBit sosem 2016-wieners-sitzung-00_themenueberblick
Bit sosem 2016-wieners-sitzung-00_themenueberblick
 
Bit wisem 2015-wieners-sitzung-13_Zusammenfassung II
Bit wisem 2015-wieners-sitzung-13_Zusammenfassung IIBit wisem 2015-wieners-sitzung-13_Zusammenfassung II
Bit wisem 2015-wieners-sitzung-13_Zusammenfassung II
 
Bit wisem 2015-wieners-sitzung-12_Zusammenfassung I
Bit wisem 2015-wieners-sitzung-12_Zusammenfassung IBit wisem 2015-wieners-sitzung-12_Zusammenfassung I
Bit wisem 2015-wieners-sitzung-12_Zusammenfassung I
 

BIT I SoSem 2015 | Basisinformationstechnologie II - 03_Semantic Web

  • 1. Universität zu Köln. Historisch-Kulturwissenschaftliche Informationsverarbeitung Dr. Jan G. Wieners // jan.wieners@uni-koeln.de Basisinformationstechnologie II Sommersemester 2015 29. April 2015 – Semantic Web
  • 2. Ausgangspunkt: Das World Wide Web (WWW)  Einschränkungen des WWW Semantic Web  Problemstellung, Intention, Worum geht‘s?  Wissensrepräsentation  Mikroformate  RDF, RDF / XML  (Ontologien)  Anwendung: FOAF Sitzungsüberblick
  • 4.
  • 6.
  • 7.
  • 9.
  • 10.
  • 11.
  • 12.
  • 14. „Magic“ II:  Ranking: Sortierung der Treffer von hochrelevanten zu weniger relevanten Treffern „Magic“ III:  Performance: It‘s magic?
  • 15. „What‘s wrong with the web?“ – die Grenzen des WWW I. „Wer ist Jan Wieners?“  Suchanfrage: Wieners  [Wer], [ist] weniger relevante Suchterme World Wide Web
  • 16. „What‘s wrong with the web?“ – die Grenzen des WWW  II. „Zeige mir Fotos von Paris“  Suchmaschinen versuchen (mitunter), die Bedeutung eines Bildes / das im Bild dargestellt durch den Kontext zu erschließen:  Dateiname  Text, der sich in Bildnähe befindet
  • 17. „What‘s wrong with the web?“ – die Grenzen des WWW  III. „Finde Musik, die ich mögen könnte“  Knackpunkt: Hintergrundwissen – Welche Musik mag ich derzeit? (Musikgeschmack verändert sich mitunter) World Wide Web
  • 18. Oh weh, was meint sie / er damit bloß??? Knackpunkt: Den Computermechanismen mangelt‘s an Wissen! „knowledge gap“:  Probleme im Verständnis natürlicher Sprache  Interpretation des Inhaltes von Bildern oder anderen multimedialen Dingen  Computer verfügt nicht über Hintergrundwissen über das der Benutzer / die Benutzerin verfügt  Computer verfügt nicht über Hintergrundwissen über die Benutzerin / den Benutzer
  • 20. Ach so ist das gemeint! …hätte sie / er das nicht gleich sagen können?!? ToDo: Wissenslücke zwischen Benutzer und Computer mindern  Bereitstellung von Wissen in einer Art und Weise, in der es von Computern verarbeitet werden und für weiteres Schließen verwendet werden kann  Z.B.: Bereitstellung von (semantischen) Metainformationen, die die Inhalte der Website beschreiben (description, keywords, etc.)
  • 21.
  • 22.
  • 23. Bild + Metadaten  Schlüsselwörter  Georeferenzierung ◦ Adresskodierung (Postanschrift) ◦ Zuweisung von Koordinaten (Geotagging) ◦ …
  • 24.  Konzept des Semantic Web formuliert 1996 von Tim Berners-Lee  Kerntechnologien (logikbasierte Sprachen zur Representation von Wissen und (automatisiertem) Schließen) entwickelt im Forschungsfeld der Künstlichen Intelligenz.  Standards: W3C  Ursprüngliche Intention: Annotation – Anreicherung der Inhalte im WWW durch Metadaten Semantic Web
  • 25.
  • 26. Menschliches Denken Rationales Denken „[Die Automatisierung von] Aktivitäten, die wir dem menschlichen Denken zuordnen, Aktivitäten wie beispielsweise Entscheidungsfindung, Problemlösung, Lernen.“ (Bellman, 1978) „Die Studie mentaler Fähigkeiten durch die Nutzung programmiertechnischer Modelle.“ (Charniak und McDermott,1985) Menschliches Handeln Rationales Handeln „Das Studium des Problems, Computer dazu zu bringen, Dinge zu tun, bei denen ihnen momentan der Mensch noch überlegen ist.“ (Rich und Knight, 1991) „Computerintelligenz ist die Studie des Entwurfs intelligenter Agenten.“ (Poole et al., 1998) Fokussierungsweisen von KI nach Russell / Norvig
  • 27. Semantic Web I: Semantische Annotation durch Mikroformate
  • 28. „Designed for humans first and machines second, microformats are a set of simple, open data formats built upon existing and widely adopted standards.” (http://microformats.org/) Mikroformate
  • 29. Beispiel: Mikroformat „hCard“ (vgl. http://de.wikipedia.org/wiki/Mikroformate): XHTML / HTML, einfach: <div> <div>Max Mustermann</div> <div>Musterfirma</div <div>01234/56789</div> <a href="http://example.com/">http://example.com/</a> </div> Semantic Web
  • 30. Beispiel: Mikroformat „hCard“ (vgl. http://de.wikipedia.org/wiki/Mikroformate): XHTML, einfach: <div> <div>Max Mustermann</div> <div>Musterfirma</div <div>01234/56789</div> <a href="http://example.com/">http://example.com/</a> </div> Im Mikroformat „hCard“: <div class="vcard"> <div class="fn">Max Mustermann</div> <div class="org">Musterfirma</div> <div class="tel">01234/56789</div> <a class="url" href="http://example.com/">http://example.com/</a> </div> Semantic Web
  • 31. Semantic Web II: Das Resource Description Framework (RDF)
  • 33.  Extensible Markup Language (XML)  „Wohlgeformtheit“?  Gültigkeit (Validität)?  DTD?  XML Schema? Schematron? RELAX NG? XML?
  • 34. Natürlichsprachige Aussage: Die Webseite „http://www.example.org“ hat einen Urheber namens Jan Wieners. Die Aussage besteht aus dem Gegenstand der Aussage, einer Eigenschaft des Gegenstandes und einem Wert für diese Eigenschaft. In RDF Terminologie wird der Gegenstand der Aussage als Subjekt (subject), die Eigenschaft als Prädikat (predicate) und Wert der Eigenschaft als Objekt (object) bezeichnet.  Subjekt, Prädikat und Objekt bilden ein Tripel. RDF Grundkonzepte
  • 35. Ein oder mehrere Tripel bilden einen RDF- Graphen: RDF (Graphen)modell Subject A Object A Predicate A Object B Predicate B
  • 36.  Bestandteile der Aussage getrennt von Leerzeichen  URI in spitzen Klammern  Eigenschaftswerte in Anführungszeichen  Standardnotationsformate: N-Triple, Turtle, etc. „Das HTML-Dokument index.html wurde von Jan Wieners erstellt“: ex:index.html dc:creator “Jan Wieners“ N-Tripel Notation
  • 37. Namespaces / Namensräume  Klassen und Eigenschaften unterhalb des gleichen URI bilden einen Namespace. Beispiel: Dublin Core  http://purl.org/dc/elements/1.1/title  http://purl.org/dc/elements/1.1/creator  http://purl.org/dc/elements/1.1/date FOAF  http://xmlns.com/foaf/0.1 RDF
  • 38. Intention:  Globaler, eindeutiger Bezeichner für Entitäten  Unterklassen: URL, URN Beispiele:  http://de.wikipedia.org/wiki/Uniform_Resource_Ide ntifier  urn:isbn:4-7980-1224-6 Uniform Resource Identifier (URI)
  • 41. <?xml version="1.0"?> <RDF> <Description about="http://www.hki.uni-koeln.de/wieners"> <author>Jan Wieners</author> <homepage> http://www.hki.uni-koeln.de </homepage> </Description> </RDF> RDF (reduziert, ohne Namensräume) Ressource (resource)  Worum geht‘s? Eigenschaft (property) Eigenschaftswert (property value)
  • 42. <?xml version="1.0"?> <RDF> <Description about="http://www.hki.uni-koeln.de/wieners"> <author>Jan Wieners</author> <homepage> http://www.hki.uni-koeln.de </homepage> </Description> </RDF> RDF (reduziert, ohne Namensräume) Ressource (resource)  Worum geht‘s? Eigenschaft (property) Eigenschaftswert (property value) RDF-Statement = Ressource + Eigenschaft + Eigenschaftswert „Jan Wieners ist der Autor von http://www.hki.uni- koeln.de/wieners“
  • 43. RDF (mit Namensräumen) <?xml version="1.0"?> <rdf:RDF xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#" xmlns:hki="http://www.hki.uni-koeln.de"> <rdf:Description rdf:about="http://www.hki.uni- koeln.de/ITZert"> <hki:author>Jan Wieners</hki:author> <hki:homepage>http://www.hki.uni- koeln.de/wieners</hki:homepage> </rdf:Description> </rdf:RDF>
  • 44.
  • 46. „The FOAF ("Friend of a Friend") project is a community driven effort to define an RDF vocabulary for expressing metadata about people, and their interests, relationships and activities.” Grundaufbau eines FOAF-Dokumentes: RDF / XML und FOAF <?xml version="1.0"?> <rdf:RDF xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#" xmlns:rdfs="http://www.w3.org/2000/01/rdf-schema#" xmlns:foaf="http://xmlns.com/foaf/0.1/"> <!– Hier kommt das FOAF-XML rein --> </rdf:RDF>
  • 47. Hinzufügen einer Person und eines Namens: RDF / XML und FOAF <?xml version="1.0"?> <rdf:RDF xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#" xmlns:rdfs="http://www.w3.org/2000/01/rdf-schema#" xmlns:foaf="http://xmlns.com/foaf/0.1/"> <foaf:Person> <foaf:name>Jan Wieners</foaf:name> </foaf:Person> </rdf:RDF>
  • 48. Hinzufügen einer Email-Adresse: RDF / XML und FOAF <?xml version="1.0"?> <rdf:RDF xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#" xmlns:rdfs="http://www.w3.org/2000/01/rdf-schema#" xmlns:foaf="http://xmlns.com/foaf/0.1/"> <foaf:Person> <foaf:name>Jan Wieners</foaf:name> <foaf:mbox rdf:resource="mailto:jan.wieners@uni-koeln.de"/> </foaf:Person> </rdf:RDF>
  • 49. Relationen zu anderen Personen ergänzen: <?xml version="1.0"?> <rdf:RDF xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#" xmlns:rdfs="http://www.w3.org/2000/01/rdf-schema#" xmlns:foaf="http://xmlns.com/foaf/0.1/"> <foaf:Person> <foaf:name>Jan Wieners</foaf:name> <foaf:mbox rdf:resource="mailto:jan.wieners@uni-koeln.de"/> </foaf:Person> <foaf:Person rdf:nodeID="Joyce"> <foaf:name>James Joyce</foaf:name> <rdfs:seeAlso rdf:resource="http://www.example.com/jamesjoyce.rdf"/> </foaf:Person> <foaf:Person rdf:nodeID="Jan"> <foaf:name>Jan Wieners</foaf:name> <foaf:knows rdf:nodeID="Joyce"/> <foaf:knows> <foaf:Person rdf:nodeID="Murakami"> <foaf:name>Haruki Murakami</foaf:name> </foaf:Person> </foaf:knows> </foaf:Person> </rdf:RDF>
  • 50. SPARQL – SPARQL Protocol And RDF Query Language Ein Beispiel(vgl. http://de.wikipedia.org/wiki/SPARQL): PREFIX abc: <http://example.com/exampleOntology#> SELECT ?capital ?country WHERE { ?x abc:cityname ?capital; abc:isCapitalOf ?y . ?y abc:countryname ?country ; abc:isInContinent abc:Africa . } Abfrage von Informationen
  • 51. /

Notas do Editor

  1. Internet vs. WWW WWW: Sehr großer Ressourcenfundus: Dokumente bzw. Textuelle Information (HTML-Dokumente, PDF, etc.) Bilder Videodateien Konzepte: Das WWW… bietet Mechanismen, um auf Dokumente des Internets zugreifen zu können  HTTP, sowie die Eindeutige Referenzierung von Inhalten: URL bietet eine Syntax (HTML), um Dokumente anzuzeigen und miteinander zu verknüpfen (Hyperlinks) Aufruf einer Website - HTTP Client stellt Anfrage an Server Server beantwortet Anfrage, d.h. liefert ein Dokument / eine Ressource zurück HTML definiert eine Syntax, die von Rechnern verstanden werden kann  HTML sagt dem Rechner, wie das Dokument angezeigt werden soll
  2. … 1989 am CERN entwickelt Intention: Austausch von Forschungsergebnissen
  3. Vannevar Bush [ˌvæˈniː.vɚ] KBE (1890 in Everett, Massachusetts; † 30. Juni 1974 in Belmont, Massachusetts) war ein US-amerikanischer Ingenieur und Analogrechner-Pionier. Bush war eine der wichtigsten Personen der US-Kriegsführung im Zweiten Weltkrieg, er entwickelte in seinem 1945 publizierten Essay As we may think das Konzept des Memex (Memory Extender), der als ein Vorläufer des Personal Computers und des Hypertextes gilt.
  4. Der Memex (Memory Extender; dt. etwa: Gedächtnis-Erweiterer) ist ein als möglichst menschengerechtes, einfach bedienbares Wissensfindungs- und Verwertungssystem konzipierter Kompakt-Analog-Rechner, der 1945 von Vannevar Bush im Artikel As We May Think (Atlantic Monthly, Juli 1945, S. 101 ff.) fiktiv vorgestellt wurde.
  5. …die Nadel im Heuhaufen…?
  6. Probleme: Prüfung der Suchergebnisse auf Benutzerseite - daran haben wir uns gewöhnt Gefahr / Dilemma: Die Suchanfrage ist überspezifiziert  Durch Angabe weiterer Suchterme schränken wir die Trefferliste erneut ein Weiteres Problem: Es könnten Seiten im WWW existieren, die sich mit dem Suchbegriff beschäftigen, ihn jedoch nicht nennen, z.B. Jan W. (Zunehmendes Problem „Filter Bubble“: Wir bekommen nur die Suchergebnisse, die Suchmaschinenanbieter für uns vorsehen)
  7. Discovr
  8. Paradigmenwechsel: von passiver Rechenleistung zu aktiver Rechenleistung (Verständnis der Inhalte) Das Semantic Web will Computern helfen, die Bedeutung hinter den Webseiten zu "verstehen“ Das derzeitige WWW dreht sich um Dokumente Das Semantic Web dreht sich um Dinge (Menschen, Musik, Filme), um Konzepte Eine Möglichkeit: Einbettung semantischer Information in HTML-Seiten
  9. Paradigmenwechsel: von passiver Rechenleistung zu aktiver Rechenleistung (Verständnis der Inhalte) Das Semantic Web will Computern helfen, die Bedeutung hinter den Webseiten zu "verstehen“ Das derzeitige WWW dreht sich um Dokumente Das Semantic Web dreht sich um Dinge (Menschen, Musik, Filme), um Konzepte Eine Möglichkeit: Einbettung semantischer Information in HTML-Seiten
  10. Kurzer Exkurs: Künstliche Intelligenz
  11. Ein Knackpunkt: Das Semantic Web macht Arbeit. Benutzerinnen und Benutzer müssen neben Inhalten auch Metadaten, d.h. beschreibende Inhalte bereitstellen Bei Webseiten: Mikroformate
  12. Wissensrepräsentation: Ontologien und Ontologiesprachen (Ontologie: Wissenschaft vom Sein des Seienden) Ontologien werden formuliert in formalen Sprachen mit einer wohldefinierten Syntax Ontologien gründen auf der Arbeit von Gemeinschaften (Communities)  RDF und OWL = am häufigsten verwendete Sprachen Ontologien Leichtgewichtige: Unterscheidungen zwischen Klassen, Instanzen und Eigenschaften, jedoch nur minimale Beschreibung der Konzepte Schwergewichtige: Machen‘s möglich, präziser zu beschreiben, wie Klassen von anderen Klassen abgeleitet sind  In der Praxis: leichtgewichtige Ontologien
  13. The Resource Description Framework (RDF) Erfunden, um Ressourcen im WWW zu beschreiben Anders als Mikroformate: Machines first Domänenunabhängig, d.h. kann auch dazu verwendet werden, Entitäten der realen Welt zu beschreiben RDF ist eine einfache Modellierungssprache, ist jedoch die Grundlage für komplexere Sprachen wie OWL
  14. (Binäre) Relationen
  15. RDF-Graphen lassen sich visuell darstellen: (Subjekt und Objekt sind dann die Knoten, Prädikate die Kanten im Graphen)
  16. Namensraum Vordefiniert, selbst definierter Namensraum Ontologie
  17. URL
  18. Frag findet die Namen aller afrikanischen Hauptstädte und das Land, in dem sich die jeweilige Hauptstadt befindet.ezeichen = Variablen