2. Tobias Kuhn, Mercator-Preis 2009, Universität Zürich 2
Problem
Das World Wide Web enthält Unmengen von Informationen, wovon
der Grossteil in natürlicher Sprache verfasst ist
Automatisches Verstehen natürlicher Sprache durch Computer ist
ein ungelöstes Problem trotz jahrzehntelanger Forschung
Folgen:
Nur Stichwort-basierte Suche
Keine automatische Beantwortung von Fragen
Keine “intelligenten” Programme, die das Wissen aus dem Web
anwenden
3. Tobias Kuhn, Mercator-Preis 2009, Universität Zürich 3
Problem: Beispiel
Die Frage kann nicht automatisch beantwortet werden, obwohl die
nötige Information vorhanden ist
“Welche Städte in einem Binnenland haben mindestens
zwei Universitäten?”
4. Tobias Kuhn, Mercator-Preis 2009, Universität Zürich 4
Mögliche Lösung: formale
Wissensrepräsentation
Idee: die Information wird nicht in natürlicher Sprache sondern in
einer formalen, Logik-basierten Sprache repräsentiert:
Sogenannte “Reasoner” können dann verschiedene Probleme
automatisch lösen:
Konsistenzprüfung: Gibt es irgendwo einen Widerspruch?
Antworten zu einer Frage fnden
Beweise führen
Problem: Die Logiknotationen sind schwierig zu verstehen ohne
spezifsche Ausbildung
∀X(country(X) ⋀ –∃Y(sea(Y) ⋀ border(X,Y)) → landlocked(X))
5. Tobias Kuhn, Mercator-Preis 2009, Universität Zürich 5
Natürliche und formale Sprachen
Countries that border
no sea are landlocked
countries.
∀X(country(X) ⋀
–∃Y(sea(Y) ⋀
border(X,Y)
) →
landlocked(X)
)
6. Tobias Kuhn, Mercator-Preis 2009, Universität Zürich 6
Kontrollierte natürliche Sprachen
Kontrollierte natürliche Sprachen sind Teilmengen von natürlichen
Sprachen
Formale Sprachen, die natürlich aussehen
Vereinen die intuitive Verständlichkeit natürlicher Sprachen mit
der Exaktheit formaler Sprachen
Sollen die Kommunikation zwischen Mensch und Computer
verbessern
Direkte Verbindung zu formaler Logik
Beispiel: Attempto Controlled English (ACE)
∀X(country(X) ⋀ –∃Y(sea(Y) ⋀
border(X,Y)) → landlocked(X))
Every country that borders no
sea is a landlocked country.
7. Tobias Kuhn, Mercator-Preis 2009, Universität Zürich 7
Kontrollierte natürliche Sprache
Every country that
borders no sea is a
landlocked country.
∀X(country(X) ⋀
–∃Y(sea(Y) ⋀
border(X,Y)
) →
landlocked(X)
)
8. Tobias Kuhn, Mercator-Preis 2009, Universität Zürich 8
AceWiki
AceWiki ist ein Wiki (wie z.B. Wikipedia)
Artikel in AceWiki sind in ACE geschrieben, wodurch deren Inhalt
automatisch in Logik übersetzt werden kann
Ein “Reasoner” ist integriert:
Konsistenzprüfung
Beantwortung von Fragen (formuliert in ACE)
Extraktion von Wort-Hierarchien
Spezieller Editor um syntaktisch korrekte ACE Sätze zu erstellen
12. Tobias Kuhn, Mercator-Preis 2009, Universität Zürich 12
Evaluation
Experimentelle Verständlichkeits-Evaluation von ACE und einer
anderen Logik-Sprache
Aufgabe: Klassifkation von Aussagen als wahr/falsch
Resultat: ACE wurde besser verstanden, benötigte weniger
Lernzeit und wurde von den Subjekten bevorzugt!
Zwei kleine Experimente zur Benutzbarkeit von AceWiki
Aufgabe: Erstellung einer Wissensbasis mit AceWiki
Resultat:
Ca. 80% der Aussagen waren korrekt und sinnvoll
Die Subjekte fügten alle 5–6 Minuten eine korrekte und
sinnvolle Aussage hinzu
13. Tobias Kuhn, Mercator-Preis 2009, Universität Zürich 13
Fazit
Kontrollierte natürliche Sprache …
… kann die Kluft überbrücken zwischen Menschen,
die in natürlicher Sprache kommunizieren, und
Computern, die nur formale Sprachen verstehen.
... ermöglicht den einfachen und intuitiven Umgang
mit formalen Wissensrepräsentationen.