SlideShare ist ein Scribd-Unternehmen logo
1 von 14
Downloaden Sie, um offline zu lesen
Wissensrepräsentation in
kontrolliertem Englisch
Tobias Kuhn
Institut für Informatik & Institut für Computerlinguistik
Universität Zürich
Mercator-Preis
22. September 2009
???? ??
??
?
Tobias Kuhn, Mercator-Preis 2009, Universität Zürich 2
Problem
 Das World Wide Web enthält Unmengen von Informationen, wovon
der Grossteil in natürlicher Sprache verfasst ist
 Automatisches Verstehen natürlicher Sprache durch Computer ist
ein ungelöstes Problem trotz jahrzehntelanger Forschung
 Folgen:
 Nur Stichwort-basierte Suche
 Keine automatische Beantwortung von Fragen
 Keine “intelligenten” Programme, die das Wissen aus dem Web
anwenden
Tobias Kuhn, Mercator-Preis 2009, Universität Zürich 3
Problem: Beispiel
 Die Frage kann nicht automatisch beantwortet werden, obwohl die
nötige Information vorhanden ist
“Welche Städte in einem Binnenland haben mindestens
zwei Universitäten?”
Tobias Kuhn, Mercator-Preis 2009, Universität Zürich 4
Mögliche Lösung: formale
Wissensrepräsentation
 Idee: die Information wird nicht in natürlicher Sprache sondern in
einer formalen, Logik-basierten Sprache repräsentiert:
 Sogenannte “Reasoner” können dann verschiedene Probleme
automatisch lösen:
 Konsistenzprüfung: Gibt es irgendwo einen Widerspruch?
 Antworten zu einer Frage fnden
 Beweise führen
 Problem: Die Logiknotationen sind schwierig zu verstehen ohne
spezifsche Ausbildung
∀X(country(X) ⋀ –∃Y(sea(Y) ⋀ border(X,Y)) → landlocked(X))
Tobias Kuhn, Mercator-Preis 2009, Universität Zürich 5
Natürliche und formale Sprachen
Countries that border
no sea are landlocked
countries.
∀X(country(X) ⋀
–∃Y(sea(Y) ⋀
border(X,Y)
) →
landlocked(X)
)
Tobias Kuhn, Mercator-Preis 2009, Universität Zürich 6
Kontrollierte natürliche Sprachen
 Kontrollierte natürliche Sprachen sind Teilmengen von natürlichen
Sprachen
 Formale Sprachen, die natürlich aussehen
 Vereinen die intuitive Verständlichkeit natürlicher Sprachen mit
der Exaktheit formaler Sprachen
 Sollen die Kommunikation zwischen Mensch und Computer
verbessern
 Direkte Verbindung zu formaler Logik
 Beispiel: Attempto Controlled English (ACE)
∀X(country(X) ⋀ –∃Y(sea(Y) ⋀
border(X,Y)) → landlocked(X))
Every country that borders no
sea is a landlocked country.
Tobias Kuhn, Mercator-Preis 2009, Universität Zürich 7
Kontrollierte natürliche Sprache
Every country that
borders no sea is a
landlocked country.
∀X(country(X) ⋀
–∃Y(sea(Y) ⋀
border(X,Y)
) →
landlocked(X)
)
Tobias Kuhn, Mercator-Preis 2009, Universität Zürich 8
AceWiki
 AceWiki ist ein Wiki (wie z.B. Wikipedia)
 Artikel in AceWiki sind in ACE geschrieben, wodurch deren Inhalt
automatisch in Logik übersetzt werden kann
 Ein “Reasoner” ist integriert:
 Konsistenzprüfung
 Beantwortung von Fragen (formuliert in ACE)
 Extraktion von Wort-Hierarchien
 Spezieller Editor um syntaktisch korrekte ACE Sätze zu erstellen
Tobias Kuhn, Mercator-Preis 2009, Universität Zürich 9
AceWiki
Tobias Kuhn, Mercator-Preis 2009, Universität Zürich 10
Beispielfrage in AceWiki
Tobias Kuhn, Mercator-Preis 2009, Universität Zürich 11
Vorausschauender Editor
Tobias Kuhn, Mercator-Preis 2009, Universität Zürich 12
Evaluation
 Experimentelle Verständlichkeits-Evaluation von ACE und einer
anderen Logik-Sprache
 Aufgabe: Klassifkation von Aussagen als wahr/falsch
 Resultat: ACE wurde besser verstanden, benötigte weniger
Lernzeit und wurde von den Subjekten bevorzugt!
 Zwei kleine Experimente zur Benutzbarkeit von AceWiki
 Aufgabe: Erstellung einer Wissensbasis mit AceWiki
 Resultat:
 Ca. 80% der Aussagen waren korrekt und sinnvoll
 Die Subjekte fügten alle 5–6 Minuten eine korrekte und
sinnvolle Aussage hinzu
Tobias Kuhn, Mercator-Preis 2009, Universität Zürich 13
Fazit
 Kontrollierte natürliche Sprache …
 … kann die Kluft überbrücken zwischen Menschen,
die in natürlicher Sprache kommunizieren, und
Computern, die nur formale Sprachen verstehen.
 ... ermöglicht den einfachen und intuitiven Umgang
mit formalen Wissensrepräsentationen.
Tobias Kuhn, Mercator-Preis 2009, Universität Zürich 14
Vielen Dank für Ihre Aufmerksamkeit!
❤❤❤❤ ❤❤
❤❤ ❤

Weitere ähnliche Inhalte

Mehr von Tobias Kuhn

Scientific Data Publishing
Scientific Data PublishingScientific Data Publishing
Scientific Data PublishingTobias Kuhn
 
A Decentralized Network for Publishing Linked Data — Nanopublications, Trusty...
A Decentralized Network for Publishing Linked Data — Nanopublications, Trusty...A Decentralized Network for Publishing Linked Data — Nanopublications, Trusty...
A Decentralized Network for Publishing Linked Data — Nanopublications, Trusty...Tobias Kuhn
 
Science Bots: A Model for the Future of Scientific Computation?
Science Bots: A Model for the Future of Scientific Computation?Science Bots: A Model for the Future of Scientific Computation?
Science Bots: A Model for the Future of Scientific Computation?Tobias Kuhn
 
Data Publishing and Post-Publication Reviews
Data Publishing and Post-Publication ReviewsData Publishing and Post-Publication Reviews
Data Publishing and Post-Publication ReviewsTobias Kuhn
 
Semantic Publishing with Nanopublications
Semantic Publishing with Nanopublications Semantic Publishing with Nanopublications
Semantic Publishing with Nanopublications Tobias Kuhn
 
Meme Extraction from Corpora of Scientific Literature using Citation Networks
Meme Extraction from Corpora of Scientific Literature using Citation NetworksMeme Extraction from Corpora of Scientific Literature using Citation Networks
Meme Extraction from Corpora of Scientific Literature using Citation NetworksTobias Kuhn
 
A Multilingual Semantic Wiki Based on Controlled Natural Language
A Multilingual Semantic Wiki Based on Controlled Natural LanguageA Multilingual Semantic Wiki Based on Controlled Natural Language
A Multilingual Semantic Wiki Based on Controlled Natural LanguageTobias Kuhn
 
Citation Graph Analysis to Identify Memes in Scientific Literature
Citation Graph Analysis to Identify Memes in Scientific LiteratureCitation Graph Analysis to Identify Memes in Scientific Literature
Citation Graph Analysis to Identify Memes in Scientific LiteratureTobias Kuhn
 
Citation Graph Analysis to Identify Memes in Scientific Literature
Citation Graph Analysis to Identify Memes in Scientific LiteratureCitation Graph Analysis to Identify Memes in Scientific Literature
Citation Graph Analysis to Identify Memes in Scientific LiteratureTobias Kuhn
 
Trusty URIs: Verifiable, Immutable, and Permanent Digital Artifacts for Linke...
Trusty URIs: Verifiable, Immutable, and Permanent Digital Artifacts for Linke...Trusty URIs: Verifiable, Immutable, and Permanent Digital Artifacts for Linke...
Trusty URIs: Verifiable, Immutable, and Permanent Digital Artifacts for Linke...Tobias Kuhn
 
Automatische Übersetzung in einem multilingualen, semantischen Wiki
Automatische Übersetzung in einem multilingualen, semantischen WikiAutomatische Übersetzung in einem multilingualen, semantischen Wiki
Automatische Übersetzung in einem multilingualen, semantischen WikiTobias Kuhn
 
A Multilingual Semantic Wiki based on Attempto Controlled English and Grammat...
A Multilingual Semantic Wiki based on Attempto Controlled English and Grammat...A Multilingual Semantic Wiki based on Attempto Controlled English and Grammat...
A Multilingual Semantic Wiki based on Attempto Controlled English and Grammat...Tobias Kuhn
 
A Multilingual Semantic Wiki based on Attempto Controlled English and Grammat...
A Multilingual Semantic Wiki based on Attempto Controlled English and Grammat...A Multilingual Semantic Wiki based on Attempto Controlled English and Grammat...
A Multilingual Semantic Wiki based on Attempto Controlled English and Grammat...Tobias Kuhn
 
Improving Text Mining with Controlled Natural Language: A Case Study for Prot...
Improving Text Mining with Controlled Natural Language: A Case Study for Prot...Improving Text Mining with Controlled Natural Language: A Case Study for Prot...
Improving Text Mining with Controlled Natural Language: A Case Study for Prot...Tobias Kuhn
 
AceRules: Executing Rules in Controlled Natural Language
AceRules: Executing Rules in Controlled Natural LanguageAceRules: Executing Rules in Controlled Natural Language
AceRules: Executing Rules in Controlled Natural LanguageTobias Kuhn
 
AceWiki: A Natural and Expressive Semantic Wiki
AceWiki: A Natural and Expressive Semantic WikiAceWiki: A Natural and Expressive Semantic Wiki
AceWiki: A Natural and Expressive Semantic WikiTobias Kuhn
 
AceWiki: Controlled English in a Semantic Wiki
AceWiki: Controlled English in a Semantic WikiAceWiki: Controlled English in a Semantic Wiki
AceWiki: Controlled English in a Semantic WikiTobias Kuhn
 
How Controlled English can Improve Semantic Wikis
How Controlled English can Improve Semantic WikisHow Controlled English can Improve Semantic Wikis
How Controlled English can Improve Semantic WikisTobias Kuhn
 
How to Evaluate Controlled Natural Languages
How to Evaluate Controlled Natural LanguagesHow to Evaluate Controlled Natural Languages
How to Evaluate Controlled Natural LanguagesTobias Kuhn
 

Mehr von Tobias Kuhn (20)

Scientific Data Publishing
Scientific Data PublishingScientific Data Publishing
Scientific Data Publishing
 
A Decentralized Network for Publishing Linked Data — Nanopublications, Trusty...
A Decentralized Network for Publishing Linked Data — Nanopublications, Trusty...A Decentralized Network for Publishing Linked Data — Nanopublications, Trusty...
A Decentralized Network for Publishing Linked Data — Nanopublications, Trusty...
 
Science Bots: A Model for the Future of Scientific Computation?
Science Bots: A Model for the Future of Scientific Computation?Science Bots: A Model for the Future of Scientific Computation?
Science Bots: A Model for the Future of Scientific Computation?
 
Data Publishing and Post-Publication Reviews
Data Publishing and Post-Publication ReviewsData Publishing and Post-Publication Reviews
Data Publishing and Post-Publication Reviews
 
Semantic Publishing with Nanopublications
Semantic Publishing with Nanopublications Semantic Publishing with Nanopublications
Semantic Publishing with Nanopublications
 
Nanopubs
NanopubsNanopubs
Nanopubs
 
Meme Extraction from Corpora of Scientific Literature using Citation Networks
Meme Extraction from Corpora of Scientific Literature using Citation NetworksMeme Extraction from Corpora of Scientific Literature using Citation Networks
Meme Extraction from Corpora of Scientific Literature using Citation Networks
 
A Multilingual Semantic Wiki Based on Controlled Natural Language
A Multilingual Semantic Wiki Based on Controlled Natural LanguageA Multilingual Semantic Wiki Based on Controlled Natural Language
A Multilingual Semantic Wiki Based on Controlled Natural Language
 
Citation Graph Analysis to Identify Memes in Scientific Literature
Citation Graph Analysis to Identify Memes in Scientific LiteratureCitation Graph Analysis to Identify Memes in Scientific Literature
Citation Graph Analysis to Identify Memes in Scientific Literature
 
Citation Graph Analysis to Identify Memes in Scientific Literature
Citation Graph Analysis to Identify Memes in Scientific LiteratureCitation Graph Analysis to Identify Memes in Scientific Literature
Citation Graph Analysis to Identify Memes in Scientific Literature
 
Trusty URIs: Verifiable, Immutable, and Permanent Digital Artifacts for Linke...
Trusty URIs: Verifiable, Immutable, and Permanent Digital Artifacts for Linke...Trusty URIs: Verifiable, Immutable, and Permanent Digital Artifacts for Linke...
Trusty URIs: Verifiable, Immutable, and Permanent Digital Artifacts for Linke...
 
Automatische Übersetzung in einem multilingualen, semantischen Wiki
Automatische Übersetzung in einem multilingualen, semantischen WikiAutomatische Übersetzung in einem multilingualen, semantischen Wiki
Automatische Übersetzung in einem multilingualen, semantischen Wiki
 
A Multilingual Semantic Wiki based on Attempto Controlled English and Grammat...
A Multilingual Semantic Wiki based on Attempto Controlled English and Grammat...A Multilingual Semantic Wiki based on Attempto Controlled English and Grammat...
A Multilingual Semantic Wiki based on Attempto Controlled English and Grammat...
 
A Multilingual Semantic Wiki based on Attempto Controlled English and Grammat...
A Multilingual Semantic Wiki based on Attempto Controlled English and Grammat...A Multilingual Semantic Wiki based on Attempto Controlled English and Grammat...
A Multilingual Semantic Wiki based on Attempto Controlled English and Grammat...
 
Improving Text Mining with Controlled Natural Language: A Case Study for Prot...
Improving Text Mining with Controlled Natural Language: A Case Study for Prot...Improving Text Mining with Controlled Natural Language: A Case Study for Prot...
Improving Text Mining with Controlled Natural Language: A Case Study for Prot...
 
AceRules: Executing Rules in Controlled Natural Language
AceRules: Executing Rules in Controlled Natural LanguageAceRules: Executing Rules in Controlled Natural Language
AceRules: Executing Rules in Controlled Natural Language
 
AceWiki: A Natural and Expressive Semantic Wiki
AceWiki: A Natural and Expressive Semantic WikiAceWiki: A Natural and Expressive Semantic Wiki
AceWiki: A Natural and Expressive Semantic Wiki
 
AceWiki: Controlled English in a Semantic Wiki
AceWiki: Controlled English in a Semantic WikiAceWiki: Controlled English in a Semantic Wiki
AceWiki: Controlled English in a Semantic Wiki
 
How Controlled English can Improve Semantic Wikis
How Controlled English can Improve Semantic WikisHow Controlled English can Improve Semantic Wikis
How Controlled English can Improve Semantic Wikis
 
How to Evaluate Controlled Natural Languages
How to Evaluate Controlled Natural LanguagesHow to Evaluate Controlled Natural Languages
How to Evaluate Controlled Natural Languages
 

Wissensrepräsentation in kontrolliertem Englisch

  • 1. Wissensrepräsentation in kontrolliertem Englisch Tobias Kuhn Institut für Informatik & Institut für Computerlinguistik Universität Zürich Mercator-Preis 22. September 2009 ???? ?? ?? ?
  • 2. Tobias Kuhn, Mercator-Preis 2009, Universität Zürich 2 Problem  Das World Wide Web enthält Unmengen von Informationen, wovon der Grossteil in natürlicher Sprache verfasst ist  Automatisches Verstehen natürlicher Sprache durch Computer ist ein ungelöstes Problem trotz jahrzehntelanger Forschung  Folgen:  Nur Stichwort-basierte Suche  Keine automatische Beantwortung von Fragen  Keine “intelligenten” Programme, die das Wissen aus dem Web anwenden
  • 3. Tobias Kuhn, Mercator-Preis 2009, Universität Zürich 3 Problem: Beispiel  Die Frage kann nicht automatisch beantwortet werden, obwohl die nötige Information vorhanden ist “Welche Städte in einem Binnenland haben mindestens zwei Universitäten?”
  • 4. Tobias Kuhn, Mercator-Preis 2009, Universität Zürich 4 Mögliche Lösung: formale Wissensrepräsentation  Idee: die Information wird nicht in natürlicher Sprache sondern in einer formalen, Logik-basierten Sprache repräsentiert:  Sogenannte “Reasoner” können dann verschiedene Probleme automatisch lösen:  Konsistenzprüfung: Gibt es irgendwo einen Widerspruch?  Antworten zu einer Frage fnden  Beweise führen  Problem: Die Logiknotationen sind schwierig zu verstehen ohne spezifsche Ausbildung ∀X(country(X) ⋀ –∃Y(sea(Y) ⋀ border(X,Y)) → landlocked(X))
  • 5. Tobias Kuhn, Mercator-Preis 2009, Universität Zürich 5 Natürliche und formale Sprachen Countries that border no sea are landlocked countries. ∀X(country(X) ⋀ –∃Y(sea(Y) ⋀ border(X,Y) ) → landlocked(X) )
  • 6. Tobias Kuhn, Mercator-Preis 2009, Universität Zürich 6 Kontrollierte natürliche Sprachen  Kontrollierte natürliche Sprachen sind Teilmengen von natürlichen Sprachen  Formale Sprachen, die natürlich aussehen  Vereinen die intuitive Verständlichkeit natürlicher Sprachen mit der Exaktheit formaler Sprachen  Sollen die Kommunikation zwischen Mensch und Computer verbessern  Direkte Verbindung zu formaler Logik  Beispiel: Attempto Controlled English (ACE) ∀X(country(X) ⋀ –∃Y(sea(Y) ⋀ border(X,Y)) → landlocked(X)) Every country that borders no sea is a landlocked country.
  • 7. Tobias Kuhn, Mercator-Preis 2009, Universität Zürich 7 Kontrollierte natürliche Sprache Every country that borders no sea is a landlocked country. ∀X(country(X) ⋀ –∃Y(sea(Y) ⋀ border(X,Y) ) → landlocked(X) )
  • 8. Tobias Kuhn, Mercator-Preis 2009, Universität Zürich 8 AceWiki  AceWiki ist ein Wiki (wie z.B. Wikipedia)  Artikel in AceWiki sind in ACE geschrieben, wodurch deren Inhalt automatisch in Logik übersetzt werden kann  Ein “Reasoner” ist integriert:  Konsistenzprüfung  Beantwortung von Fragen (formuliert in ACE)  Extraktion von Wort-Hierarchien  Spezieller Editor um syntaktisch korrekte ACE Sätze zu erstellen
  • 9. Tobias Kuhn, Mercator-Preis 2009, Universität Zürich 9 AceWiki
  • 10. Tobias Kuhn, Mercator-Preis 2009, Universität Zürich 10 Beispielfrage in AceWiki
  • 11. Tobias Kuhn, Mercator-Preis 2009, Universität Zürich 11 Vorausschauender Editor
  • 12. Tobias Kuhn, Mercator-Preis 2009, Universität Zürich 12 Evaluation  Experimentelle Verständlichkeits-Evaluation von ACE und einer anderen Logik-Sprache  Aufgabe: Klassifkation von Aussagen als wahr/falsch  Resultat: ACE wurde besser verstanden, benötigte weniger Lernzeit und wurde von den Subjekten bevorzugt!  Zwei kleine Experimente zur Benutzbarkeit von AceWiki  Aufgabe: Erstellung einer Wissensbasis mit AceWiki  Resultat:  Ca. 80% der Aussagen waren korrekt und sinnvoll  Die Subjekte fügten alle 5–6 Minuten eine korrekte und sinnvolle Aussage hinzu
  • 13. Tobias Kuhn, Mercator-Preis 2009, Universität Zürich 13 Fazit  Kontrollierte natürliche Sprache …  … kann die Kluft überbrücken zwischen Menschen, die in natürlicher Sprache kommunizieren, und Computern, die nur formale Sprachen verstehen.  ... ermöglicht den einfachen und intuitiven Umgang mit formalen Wissensrepräsentationen.
  • 14. Tobias Kuhn, Mercator-Preis 2009, Universität Zürich 14 Vielen Dank für Ihre Aufmerksamkeit! ❤❤❤❤ ❤❤ ❤❤ ❤