SlideShare uma empresa Scribd logo
1 de 26
SPRACHERKENNUNG


                                  UNIVERSITÄT ZU KÖLN

               COMPUTERLINGUISTIK IM WS 2008 / 09

                                  JENNIFER STEINBACH
                                      BILAL ERKIN


Computerlinguistik WS 2008 / 09                        Bilal Erkin & Jennifer Steinbach
SPRACHERKENNUNG



 Was ist Spracherkennung?



      Unter Spracherkennung (engl. speech recognition)
       versteht man das Erkennen gesprochener Sprache.




Computerlinguistik WS 2008 / 09          Bilal Erkin & Jennifer Steinbach
GESCHICHTE

•   Erforschung von Spracherkennungssystemen seit den 1960er Jahren

•   bis zum Beginn der 1980er Jahre wenig Fortschritte; Erkennung von gerade mal einigen hundert
    Einzelwörtern

•   im Jahre 1962 wird von IBM das erste Sprachausgabegerät vorgestellt

•   ab 1988 Entwicklung von TANGORA deutsch in Heidelberg, es umfasst etwa 2020-30 tausend Wörter;
    Einsatzgebiete in der Medizin, dem Gerichtswesen sowie der Geschäftskorrespondenz

•   IBM entwickelt 1992 SpeechServer als Client/Server
                                         Client/Server-System
    -  Server benötigte RISC-Prozessoren
    -  Kostenpunkt um die 10.000$

•   IBM entwirft 1993 erneut ein Spracherkennungssystem  Personal DictationSystem (heute: IBM
    VoiceType)
    -  Spracherkennung erstmals für den breiten Markt
    -  Kostenpunkt unter 1.000$

•   1994 konzipiert die Firma Philips DictationSystems das erste Client/Server
                                                                 Client/Server-System für
    Spracherkennung

•   drei Jahre später entwickelte Philips DictationSystems das erste Konsumentenprodukt (FreeSpeech98)

Computerlinguistik WS 2008 / 09                                           Bilal Erkin & Jennifer Steinbach
SPRACHERKENNUNG

 Sprecherunabhängige Spracherkennung
      Keine Trainingsphase
      Geringer Wortschatz
      Mehrere Benutzer möglich




 Sprecherabhängige Spracherkennung
      Anpassung auf den jeweiligen Benutzer
      Trainingsphase
      Keine wechselnden Benutzer möglich

Computerlinguistik WS 2008 / 09                Bilal Erkin & Jennifer Steinbach
HERAUSFORDERUNGEN
                HERAUSFORDERUNGE


                                      AUSSPRACHE

                                  UMGEBUNGSGERÄUSCHE

                                      HOMOPHONE

                                   VOKALERKENNUNG



Computerlinguistik WS 2008 / 09                        Bilal Erkin & Jennifer Steinbach
AUSSPRACHE

 Diskrete Sprache
      Künstliche Pause zwischen den Wörtern




 Kontinuierliche Sprache
      Flüssige Aussprache ohne Pause



                                                      Bilder: www.wikipedia.de
Computerlinguistik WS 2008 / 09                Bilal Erkin & Jennifer Steinbach
UMGEBUNGSGERÄUSCHE

 Bürolärm


 Fahrgeräusche


 Andere Personen


 Rauschen der Telefonleitung


 Diese sollten entfernt werden
Computerlinguistik WS 2008 / 09    Bilal Erkin & Jennifer Steinbach
HOMOPHONE

 Wörter die identisch klingen, aber eine andere
   Bedeutung haben

 Meer ≠ mehr


 Graf ≠ Graph


 Usw…

Computerlinguistik WS 2008 / 09               Bilal Erkin & Jennifer Steinbach
VOKALERKENNUNG



 Vokale sind von ihren Frequenzbereichen zu
   unterscheiden



 „O“ liegt im Frequenzbereich tiefer als „E“




Computerlinguistik WS 2008 / 09         Bilal Erkin & Jennifer Steinbach
REALISIERUNG

                                     VORVERARBEITUNG

                                   MERKMALSEXTRAKTION

                                  UNTEREINHEITENVERGLEICH

                                  HIDDEN-MARKOV-MODELLE

                     SYNTAKTISCHE / SEMANTISCHE ANALYSE



Computerlinguistik WS 2008 / 09                         Bilal Erkin & Jennifer Steinbach
VORVERARBEITUNG


 Entfernung von Störgeräuschen


 Entfernung von Sprachsignalen anderer
   Personen

Ziel: Vereinfachung und Beschleunigung der
  Weiterverarbeitung


Computerlinguistik WS 2008 / 09         Bilal Erkin & Jennifer Steinbach
MERKMALSEXTRAKTION



 Blockweise Aufteilung des Audiosignals




 Abfolge von Merkmalsvektoren




Computerlinguistik WS 2008 / 09      Bilal Erkin & Jennifer Steinbach
UNTEREINHEITENVERGLEICH


 Umwandlung der Merkmalsvektoren in Phoneme,
   Silben und Wörter



 Angewendete Sprachmoddelle:
      Hidden-Markov-Modelle
      Neuronale Netze
      …


Computerlinguistik WS 2008 / 09   Bilal Erkin & Jennifer Steinbach
HIDDEN-MARKOV
                       MARKOV-MODELLE

 Stochastische Methode, um Phoneme zu finden,
   die am besten zu den Eingangssignalen passen

 Fehlt ein wichtiges Phonem, kann das Wort nicht
   zugeordnet werden

 HMMs berechnen die Wahrscheinlichkeit aus
   welcher Folge von Phonemen das Wort
   enstanden sein könnte

Computerlinguistik WS 2008 / 09   Bilal Erkin & Jennifer Steinbach
HIDDEN-MARKOV MODELLE
                         MARKOV

 Jedes Phonem wird durch einen Zustand
   dargstellt




              O                   F   E              N




Computerlinguistik WS 2008 / 09           Bilal Erkin & Jennifer Steinbach
HIDDEN-MARKOV MODELLE - II
                   MARKOV

 Übergänge zu den nächsten Zuständen enthalten
   Wahrscheinlichkeitswerte




              O                   F   E              N




Computerlinguistik WS 2008 / 09           Bilal Erkin & Jennifer Steinbach
HIDDEN-MARKOV MODELLE - Ablauf
             MARKOV

 Aussuchen eines Phonems und Vergleich mit
  dem Audiosignal
 Wiederholdung, falls keine Übereinstimmung




Computerlinguistik WS 2008 / 09   Bilal Erkin & Jennifer Steinbach
HIDDEN-MARKOV MODELLE - Ablauf
             MARKOV

 Ausgabe des Phonems bei Übereinstimmung




              O




Computerlinguistik WS 2008 / 09   Bilal Erkin & Jennifer Steinbach
HIDDEN-MARKOV MODELLE - Ablauf
             MARKOV

 Übergang zum nächsten Zustand




              O




Computerlinguistik WS 2008 / 09   Bilal Erkin & Jennifer Steinbach
HIDDEN-MARKOV MODELLE - Ablauf
             MARKOV

 Übergang zum nächsten Zustand




              O                   F   E              N




Computerlinguistik WS 2008 / 09           Bilal Erkin & Jennifer Steinbach
HIDDEN-MARKOV MODELLE – Ablauf
             MARKOV

 HMMs können auch auf anderen Ebenen
   angewendet werden (Syntax, Semantik)




              O                   F   E              N




Computerlinguistik WS 2008 / 09           Bilal Erkin & Jennifer Steinbach
SYNTAKTISCHE / SEMANTISCHE ANALYSE


 Syntaktische Analyse
      Zulassung von Wörtern, die nur im Wörterbuch vorhanden
       sind
      Vorgegebene Reihenfolge der Wörter (Grammatik)


 Semantische Analyse
      Erkennung der Satzstruktur




Computerlinguistik WS 2008 / 09             Bilal Erkin & Jennifer Steinbach
PERSPEKTIVEN


 Keinen universellen Spracherkenner


 Systeme für spezielle Anwendungen


 Optimierung bei der Entfernung der
   Umgebungsgeräusche

 Erkennung unbekannter Wörter

Computerlinguistik WS 2008 / 09                  Bilal Erkin & Jennifer Steinbach
WINDOWS VISTA - SPRACHERKENNUNG

• Windows Vista verfügt über leistungsstarke
   Sprachfeatures

• Mit Hilfe dieser Sprachfeatures wird dem Anwender
   ermöglicht, den Computer statt mit der Tastatur oder
   der Maus mittels Sprachbefehlen zu steuern.

• Die Spracherkennung unter Windows Vista ermöglicht
   die Interaktion mit dem Computer per Stimme.

• Es können Dokumente und E
                          E-Mail-Nachrichten in
   gängigen Anwendungen diktiert und Formulare im
   Internet mit Hilfe von Sprachbefehlen ausgefüllt werden.

Computerlinguistik WS 2008 / 09          Bilal Erkin & Jennifer Steinbach
SPRACHERKENNUNG - ENTWICKLUNG

• Entwicklung von         multilingualen Spracherkennungssystemen

• Multilinguale Spracherkennungssysteme:
   o   Dies sind Systeme, die für mehrere Sprachen gleichzeitig genutzt
       werden können.

       Vorteile:
       - man kann während des Diktiervorgangs zwischen den Sprachen wechseln

       Nachteile:
       - Entwicklung sehr kostspielig, da erst das gesamte Vokabular der
         jeweiligen Sprache erfasst werden muss

       -   Entwicklungsdauer somit sehr lang

       -   es gibt bis jetzt kein System, das diese Fähigkeiten aufweist



Computerlinguistik WS 2008 / 09                              Bilal Erkin & Jennifer Steinbach
QUELLENNACHWEIS


•    http://digbib.ubka.uni-karlsruhe.de/volltexte/1000008467
                            karlsruhe.de/volltexte/1000008467

•    http://www.lars-lehre.de/download/Vorlesung5.pdf

•    http://www.fh-wedel.de/~si/seminare/ss01/Ausarbeitung/a.sprache/gdlgsprerk12.htm
                   wedel.de/~si/seminare/ss01/Ausarbeitung/a.sprache/gdlgsprerk12.htm

•    Vater, H. (1994): Einführung in die Sprachwissenschaft. München: Fink.

•    Carstensen, K.U., Ebert, C., Endriss, C., Jekat, S., Klabunde, R., Langer, H. (2004): Computerlinguistik und
     Sprachtechnologie. Eine Einführung (2. Auflage). Heidelberg, Berlin: Spektrum.

•    Euler, Stefan: Grundkurs Spracherkennung, Vieweg-Verlag, Wiesbaden, 2006.
                                                      Verlag,

    Mitkov, Ruslan (hrsg.): The Oxford handbook of computational linguistics, Oxford University Press, Oxford, 2005.

    www8.informatik.uni-erlangen.de/IMMD8/Lectures/AI-
                                                      -GAMES/SS2002/hs/vortraege/12062002/VoiceCCC.ppt

    http://nats-www.informatik.uni-hamburg.de/~cri/MTPraktikum02_03/Paper_Signal/Slide006.html
                                    hamburg.de/~cri/MTPraktikum02_03/Paper_Signal/Slide006.html


    Computerlinguistik WS 2008 / 09                                                 Bilal Erkin & Jennifer Steinbach

Mais conteúdo relacionado

Mais procurados

Livro completo _cinesiologia_e_biomecanica-1-1.pdf
Livro completo _cinesiologia_e_biomecanica-1-1.pdfLivro completo _cinesiologia_e_biomecanica-1-1.pdf
Livro completo _cinesiologia_e_biomecanica-1-1.pdfKelvia Bailarina
 
アジャイル開発と品質保証の密なる関係 #quesqa
アジャイル開発と品質保証の密なる関係 #quesqaアジャイル開発と品質保証の密なる関係 #quesqa
アジャイル開発と品質保証の密なる関係 #quesqaques_staff
 
.NET Framework におけるタイムゾーンの取り扱い
.NET Framework におけるタイムゾーンの取り扱い.NET Framework におけるタイムゾーンの取り扱い
.NET Framework におけるタイムゾーンの取り扱いMicrosoft Corporation
 
Massagem relaxante
Massagem relaxanteMassagem relaxante
Massagem relaxanteLauro Cesar
 
DEMENCIAS E ALZHEIMER DIAGNÓSTICO E TRATAMENTO
DEMENCIAS E ALZHEIMER DIAGNÓSTICO E TRATAMENTODEMENCIAS E ALZHEIMER DIAGNÓSTICO E TRATAMENTO
DEMENCIAS E ALZHEIMER DIAGNÓSTICO E TRATAMENTORubens Junior
 
Alimentação e Ayurveda
Alimentação e AyurvedaAlimentação e Ayurveda
Alimentação e AyurvedaMichele Pó
 
品質を落とさずにウォーターフォール開発から徐々にアジャイル開発へとシフトしてみる
品質を落とさずにウォーターフォール開発から徐々にアジャイル開発へとシフトしてみる品質を落とさずにウォーターフォール開発から徐々にアジャイル開発へとシフトしてみる
品質を落とさずにウォーターフォール開発から徐々にアジャイル開発へとシフトしてみるJumpeiIto2
 
トヨタ生産方式とアジャイル開発20121210
トヨタ生産方式とアジャイル開発20121210トヨタ生産方式とアジャイル開発20121210
トヨタ生産方式とアジャイル開発20121210Kazutaka Sankai
 
Condutas terapêuticas na hérnia de disco lombar
Condutas terapêuticas na hérnia de disco lombarCondutas terapêuticas na hérnia de disco lombar
Condutas terapêuticas na hérnia de disco lombaradrianomedico
 
Apostila cinesioterapia basica
Apostila cinesioterapia basicaApostila cinesioterapia basica
Apostila cinesioterapia basicaNatha Fisioterapia
 
Apostila reflexologia - Edduc
Apostila reflexologia - EdducApostila reflexologia - Edduc
Apostila reflexologia - Edducedduc
 
Noções Básicas de Acupuntura
Noções Básicas de AcupunturaNoções Básicas de Acupuntura
Noções Básicas de AcupunturaFatima Dinis
 
Ayurveda - Práticas Alternativas de Saúde.
Ayurveda - Práticas Alternativas de Saúde.Ayurveda - Práticas Alternativas de Saúde.
Ayurveda - Práticas Alternativas de Saúde.Lara Lídia
 
Aromaterapia Phitotherápica - Juliana Marchetti
Aromaterapia Phitotherápica  - Juliana MarchettiAromaterapia Phitotherápica  - Juliana Marchetti
Aromaterapia Phitotherápica - Juliana MarchettiJuliana Marchetti
 
Fisioterapia aquática.pptx
Fisioterapia aquática.pptxFisioterapia aquática.pptx
Fisioterapia aquática.pptxLuizPauloMilares
 
Anatomia do JSF, JavaServer Faces
Anatomia do JSF, JavaServer FacesAnatomia do JSF, JavaServer Faces
Anatomia do JSF, JavaServer FacesRafael Ponte
 
Alzheimer terapias complementares
Alzheimer terapias complementaresAlzheimer terapias complementares
Alzheimer terapias complementaresLuciana Mateus
 

Mais procurados (20)

Dor lombar
Dor lombarDor lombar
Dor lombar
 
Livro completo _cinesiologia_e_biomecanica-1-1.pdf
Livro completo _cinesiologia_e_biomecanica-1-1.pdfLivro completo _cinesiologia_e_biomecanica-1-1.pdf
Livro completo _cinesiologia_e_biomecanica-1-1.pdf
 
アジャイル開発と品質保証の密なる関係 #quesqa
アジャイル開発と品質保証の密なる関係 #quesqaアジャイル開発と品質保証の密なる関係 #quesqa
アジャイル開発と品質保証の密なる関係 #quesqa
 
.NET Framework におけるタイムゾーンの取り扱い
.NET Framework におけるタイムゾーンの取り扱い.NET Framework におけるタイムゾーンの取り扱い
.NET Framework におけるタイムゾーンの取り扱い
 
Massagem relaxante
Massagem relaxanteMassagem relaxante
Massagem relaxante
 
DEMENCIAS E ALZHEIMER DIAGNÓSTICO E TRATAMENTO
DEMENCIAS E ALZHEIMER DIAGNÓSTICO E TRATAMENTODEMENCIAS E ALZHEIMER DIAGNÓSTICO E TRATAMENTO
DEMENCIAS E ALZHEIMER DIAGNÓSTICO E TRATAMENTO
 
Alimentação e Ayurveda
Alimentação e AyurvedaAlimentação e Ayurveda
Alimentação e Ayurveda
 
品質を落とさずにウォーターフォール開発から徐々にアジャイル開発へとシフトしてみる
品質を落とさずにウォーターフォール開発から徐々にアジャイル開発へとシフトしてみる品質を落とさずにウォーターフォール開発から徐々にアジャイル開発へとシフトしてみる
品質を落とさずにウォーターフォール開発から徐々にアジャイル開発へとシフトしてみる
 
トヨタ生産方式とアジャイル開発20121210
トヨタ生産方式とアジャイル開発20121210トヨタ生産方式とアジャイル開発20121210
トヨタ生産方式とアジャイル開発20121210
 
Condutas terapêuticas na hérnia de disco lombar
Condutas terapêuticas na hérnia de disco lombarCondutas terapêuticas na hérnia de disco lombar
Condutas terapêuticas na hérnia de disco lombar
 
Apostila cinesioterapia basica
Apostila cinesioterapia basicaApostila cinesioterapia basica
Apostila cinesioterapia basica
 
Paralisia facial
Paralisia facialParalisia facial
Paralisia facial
 
Apostila reflexologia - Edduc
Apostila reflexologia - EdducApostila reflexologia - Edduc
Apostila reflexologia - Edduc
 
Reflexologia
ReflexologiaReflexologia
Reflexologia
 
Noções Básicas de Acupuntura
Noções Básicas de AcupunturaNoções Básicas de Acupuntura
Noções Básicas de Acupuntura
 
Ayurveda - Práticas Alternativas de Saúde.
Ayurveda - Práticas Alternativas de Saúde.Ayurveda - Práticas Alternativas de Saúde.
Ayurveda - Práticas Alternativas de Saúde.
 
Aromaterapia Phitotherápica - Juliana Marchetti
Aromaterapia Phitotherápica  - Juliana MarchettiAromaterapia Phitotherápica  - Juliana Marchetti
Aromaterapia Phitotherápica - Juliana Marchetti
 
Fisioterapia aquática.pptx
Fisioterapia aquática.pptxFisioterapia aquática.pptx
Fisioterapia aquática.pptx
 
Anatomia do JSF, JavaServer Faces
Anatomia do JSF, JavaServer FacesAnatomia do JSF, JavaServer Faces
Anatomia do JSF, JavaServer Faces
 
Alzheimer terapias complementares
Alzheimer terapias complementaresAlzheimer terapias complementares
Alzheimer terapias complementares
 

Destaque

Hidden Markov Modelle
Hidden Markov ModelleHidden Markov Modelle
Hidden Markov ModelleBilal Erkin
 
Radikal Islamische Bewegungen
Radikal Islamische BewegungenRadikal Islamische Bewegungen
Radikal Islamische BewegungenBilal Erkin
 
Übergangswahrscheinlichkeiten
ÜbergangswahrscheinlichkeitenÜbergangswahrscheinlichkeiten
ÜbergangswahrscheinlichkeitenBilal Erkin
 
Hadithterminologie
HadithterminologieHadithterminologie
HadithterminologieBilal Erkin
 
Rich ajax platform (rap)
Rich ajax platform (rap)Rich ajax platform (rap)
Rich ajax platform (rap)Bilal Erkin
 
Die Türkische Sprache (Morphologie - Grammatik - Syntax)
Die Türkische Sprache (Morphologie - Grammatik - Syntax)Die Türkische Sprache (Morphologie - Grammatik - Syntax)
Die Türkische Sprache (Morphologie - Grammatik - Syntax)Bilal Erkin
 
Schächten im Namen Gottes: Sonderrecht für Muslime?
Schächten im Namen Gottes: Sonderrecht für Muslime?Schächten im Namen Gottes: Sonderrecht für Muslime?
Schächten im Namen Gottes: Sonderrecht für Muslime?Bilal Erkin
 
Eine Biografie aus der ADB/NDB als XML
Eine Biografie aus der ADB/NDB als XMLEine Biografie aus der ADB/NDB als XML
Eine Biografie aus der ADB/NDB als XMLBilal Erkin
 
Strafrechtspflege im Osmanischen Reich
Strafrechtspflege im Osmanischen ReichStrafrechtspflege im Osmanischen Reich
Strafrechtspflege im Osmanischen ReichBilal Erkin
 
Klassifizierung von Hadithen
Klassifizierung von HadithenKlassifizierung von Hadithen
Klassifizierung von HadithenBilal Erkin
 
al-ʾĀmidī und sein Werk „al-muwāzana bayna šiʿr Abī Tammām wal-Buḫturī“
al-ʾĀmidī  und sein Werk „al-muwāzana bayna šiʿr Abī Tammām wal-Buḫturī“al-ʾĀmidī  und sein Werk „al-muwāzana bayna šiʿr Abī Tammām wal-Buḫturī“
al-ʾĀmidī und sein Werk „al-muwāzana bayna šiʿr Abī Tammām wal-Buḫturī“Bilal Erkin
 
A compilation of the Abridged Tafsir Ibn Kathir Volumes 1 - 10 ( commentary ...
A compilation of the Abridged Tafsir Ibn Kathir Volumes 1 - 10  ( commentary ...A compilation of the Abridged Tafsir Ibn Kathir Volumes 1 - 10  ( commentary ...
A compilation of the Abridged Tafsir Ibn Kathir Volumes 1 - 10 ( commentary ...Islamic Invitation
 
Mystik im Islam und Christentum
Mystik im Islam und ChristentumMystik im Islam und Christentum
Mystik im Islam und ChristentumBilal Erkin
 
Praktikum beim Orient Institut Istanbul - Vorbereitung und Zeit vor Ort
Praktikum beim Orient Institut Istanbul - Vorbereitung und Zeit vor OrtPraktikum beim Orient Institut Istanbul - Vorbereitung und Zeit vor Ort
Praktikum beim Orient Institut Istanbul - Vorbereitung und Zeit vor OrtBilal Erkin
 
Menschenrecht Meinungsfreiheit - Vortrag der Stresemann Stiftung
Menschenrecht Meinungsfreiheit - Vortrag der Stresemann StiftungMenschenrecht Meinungsfreiheit - Vortrag der Stresemann Stiftung
Menschenrecht Meinungsfreiheit - Vortrag der Stresemann StiftungStresemann Stiftung
 
Islam in Deutschland zwischen Anspruch und Integration
Islam in Deutschland zwischen Anspruch und IntegrationIslam in Deutschland zwischen Anspruch und Integration
Islam in Deutschland zwischen Anspruch und IntegrationBilal Erkin
 
Malaysia
MalaysiaMalaysia
MalaysiaJen S
 
Secrets of Surat Al-Kahf
Secrets of Surat Al-KahfSecrets of Surat Al-Kahf
Secrets of Surat Al-KahfMohammed Faris
 
Intro to islam power point presentation
Intro to islam power point presentationIntro to islam power point presentation
Intro to islam power point presentationmanishonlin
 

Destaque (20)

Hidden Markov Modelle
Hidden Markov ModelleHidden Markov Modelle
Hidden Markov Modelle
 
Radikal Islamische Bewegungen
Radikal Islamische BewegungenRadikal Islamische Bewegungen
Radikal Islamische Bewegungen
 
Übergangswahrscheinlichkeiten
ÜbergangswahrscheinlichkeitenÜbergangswahrscheinlichkeiten
Übergangswahrscheinlichkeiten
 
Hadithterminologie
HadithterminologieHadithterminologie
Hadithterminologie
 
Rich ajax platform (rap)
Rich ajax platform (rap)Rich ajax platform (rap)
Rich ajax platform (rap)
 
Die Türkische Sprache (Morphologie - Grammatik - Syntax)
Die Türkische Sprache (Morphologie - Grammatik - Syntax)Die Türkische Sprache (Morphologie - Grammatik - Syntax)
Die Türkische Sprache (Morphologie - Grammatik - Syntax)
 
Schächten im Namen Gottes: Sonderrecht für Muslime?
Schächten im Namen Gottes: Sonderrecht für Muslime?Schächten im Namen Gottes: Sonderrecht für Muslime?
Schächten im Namen Gottes: Sonderrecht für Muslime?
 
Eine Biografie aus der ADB/NDB als XML
Eine Biografie aus der ADB/NDB als XMLEine Biografie aus der ADB/NDB als XML
Eine Biografie aus der ADB/NDB als XML
 
Strafrechtspflege im Osmanischen Reich
Strafrechtspflege im Osmanischen ReichStrafrechtspflege im Osmanischen Reich
Strafrechtspflege im Osmanischen Reich
 
Klassifizierung von Hadithen
Klassifizierung von HadithenKlassifizierung von Hadithen
Klassifizierung von Hadithen
 
al-ʾĀmidī und sein Werk „al-muwāzana bayna šiʿr Abī Tammām wal-Buḫturī“
al-ʾĀmidī  und sein Werk „al-muwāzana bayna šiʿr Abī Tammām wal-Buḫturī“al-ʾĀmidī  und sein Werk „al-muwāzana bayna šiʿr Abī Tammām wal-Buḫturī“
al-ʾĀmidī und sein Werk „al-muwāzana bayna šiʿr Abī Tammām wal-Buḫturī“
 
A compilation of the Abridged Tafsir Ibn Kathir Volumes 1 - 10 ( commentary ...
A compilation of the Abridged Tafsir Ibn Kathir Volumes 1 - 10  ( commentary ...A compilation of the Abridged Tafsir Ibn Kathir Volumes 1 - 10  ( commentary ...
A compilation of the Abridged Tafsir Ibn Kathir Volumes 1 - 10 ( commentary ...
 
Mystik im Islam und Christentum
Mystik im Islam und ChristentumMystik im Islam und Christentum
Mystik im Islam und Christentum
 
Praktikum beim Orient Institut Istanbul - Vorbereitung und Zeit vor Ort
Praktikum beim Orient Institut Istanbul - Vorbereitung und Zeit vor OrtPraktikum beim Orient Institut Istanbul - Vorbereitung und Zeit vor Ort
Praktikum beim Orient Institut Istanbul - Vorbereitung und Zeit vor Ort
 
Menschenrecht Meinungsfreiheit - Vortrag der Stresemann Stiftung
Menschenrecht Meinungsfreiheit - Vortrag der Stresemann StiftungMenschenrecht Meinungsfreiheit - Vortrag der Stresemann Stiftung
Menschenrecht Meinungsfreiheit - Vortrag der Stresemann Stiftung
 
Surat Al-Maun
Surat Al-MaunSurat Al-Maun
Surat Al-Maun
 
Islam in Deutschland zwischen Anspruch und Integration
Islam in Deutschland zwischen Anspruch und IntegrationIslam in Deutschland zwischen Anspruch und Integration
Islam in Deutschland zwischen Anspruch und Integration
 
Malaysia
MalaysiaMalaysia
Malaysia
 
Secrets of Surat Al-Kahf
Secrets of Surat Al-KahfSecrets of Surat Al-Kahf
Secrets of Surat Al-Kahf
 
Intro to islam power point presentation
Intro to islam power point presentationIntro to islam power point presentation
Intro to islam power point presentation
 

Spracherkennung

  • 1. SPRACHERKENNUNG UNIVERSITÄT ZU KÖLN COMPUTERLINGUISTIK IM WS 2008 / 09 JENNIFER STEINBACH BILAL ERKIN Computerlinguistik WS 2008 / 09 Bilal Erkin & Jennifer Steinbach
  • 2. SPRACHERKENNUNG  Was ist Spracherkennung?  Unter Spracherkennung (engl. speech recognition) versteht man das Erkennen gesprochener Sprache. Computerlinguistik WS 2008 / 09 Bilal Erkin & Jennifer Steinbach
  • 3. GESCHICHTE • Erforschung von Spracherkennungssystemen seit den 1960er Jahren • bis zum Beginn der 1980er Jahre wenig Fortschritte; Erkennung von gerade mal einigen hundert Einzelwörtern • im Jahre 1962 wird von IBM das erste Sprachausgabegerät vorgestellt • ab 1988 Entwicklung von TANGORA deutsch in Heidelberg, es umfasst etwa 2020-30 tausend Wörter; Einsatzgebiete in der Medizin, dem Gerichtswesen sowie der Geschäftskorrespondenz • IBM entwickelt 1992 SpeechServer als Client/Server Client/Server-System - Server benötigte RISC-Prozessoren - Kostenpunkt um die 10.000$ • IBM entwirft 1993 erneut ein Spracherkennungssystem  Personal DictationSystem (heute: IBM VoiceType) - Spracherkennung erstmals für den breiten Markt - Kostenpunkt unter 1.000$ • 1994 konzipiert die Firma Philips DictationSystems das erste Client/Server Client/Server-System für Spracherkennung • drei Jahre später entwickelte Philips DictationSystems das erste Konsumentenprodukt (FreeSpeech98) Computerlinguistik WS 2008 / 09 Bilal Erkin & Jennifer Steinbach
  • 4. SPRACHERKENNUNG  Sprecherunabhängige Spracherkennung  Keine Trainingsphase  Geringer Wortschatz  Mehrere Benutzer möglich  Sprecherabhängige Spracherkennung  Anpassung auf den jeweiligen Benutzer  Trainingsphase  Keine wechselnden Benutzer möglich Computerlinguistik WS 2008 / 09 Bilal Erkin & Jennifer Steinbach
  • 5. HERAUSFORDERUNGEN HERAUSFORDERUNGE AUSSPRACHE UMGEBUNGSGERÄUSCHE HOMOPHONE VOKALERKENNUNG Computerlinguistik WS 2008 / 09 Bilal Erkin & Jennifer Steinbach
  • 6. AUSSPRACHE  Diskrete Sprache  Künstliche Pause zwischen den Wörtern  Kontinuierliche Sprache  Flüssige Aussprache ohne Pause Bilder: www.wikipedia.de Computerlinguistik WS 2008 / 09 Bilal Erkin & Jennifer Steinbach
  • 7. UMGEBUNGSGERÄUSCHE  Bürolärm  Fahrgeräusche  Andere Personen  Rauschen der Telefonleitung  Diese sollten entfernt werden Computerlinguistik WS 2008 / 09 Bilal Erkin & Jennifer Steinbach
  • 8. HOMOPHONE  Wörter die identisch klingen, aber eine andere Bedeutung haben  Meer ≠ mehr  Graf ≠ Graph  Usw… Computerlinguistik WS 2008 / 09 Bilal Erkin & Jennifer Steinbach
  • 9. VOKALERKENNUNG  Vokale sind von ihren Frequenzbereichen zu unterscheiden  „O“ liegt im Frequenzbereich tiefer als „E“ Computerlinguistik WS 2008 / 09 Bilal Erkin & Jennifer Steinbach
  • 10. REALISIERUNG VORVERARBEITUNG MERKMALSEXTRAKTION UNTEREINHEITENVERGLEICH HIDDEN-MARKOV-MODELLE SYNTAKTISCHE / SEMANTISCHE ANALYSE Computerlinguistik WS 2008 / 09 Bilal Erkin & Jennifer Steinbach
  • 11. VORVERARBEITUNG  Entfernung von Störgeräuschen  Entfernung von Sprachsignalen anderer Personen Ziel: Vereinfachung und Beschleunigung der Weiterverarbeitung Computerlinguistik WS 2008 / 09 Bilal Erkin & Jennifer Steinbach
  • 12. MERKMALSEXTRAKTION  Blockweise Aufteilung des Audiosignals  Abfolge von Merkmalsvektoren Computerlinguistik WS 2008 / 09 Bilal Erkin & Jennifer Steinbach
  • 13. UNTEREINHEITENVERGLEICH  Umwandlung der Merkmalsvektoren in Phoneme, Silben und Wörter  Angewendete Sprachmoddelle:  Hidden-Markov-Modelle  Neuronale Netze  … Computerlinguistik WS 2008 / 09 Bilal Erkin & Jennifer Steinbach
  • 14. HIDDEN-MARKOV MARKOV-MODELLE  Stochastische Methode, um Phoneme zu finden, die am besten zu den Eingangssignalen passen  Fehlt ein wichtiges Phonem, kann das Wort nicht zugeordnet werden  HMMs berechnen die Wahrscheinlichkeit aus welcher Folge von Phonemen das Wort enstanden sein könnte Computerlinguistik WS 2008 / 09 Bilal Erkin & Jennifer Steinbach
  • 15. HIDDEN-MARKOV MODELLE MARKOV  Jedes Phonem wird durch einen Zustand dargstellt O F E N Computerlinguistik WS 2008 / 09 Bilal Erkin & Jennifer Steinbach
  • 16. HIDDEN-MARKOV MODELLE - II MARKOV  Übergänge zu den nächsten Zuständen enthalten Wahrscheinlichkeitswerte O F E N Computerlinguistik WS 2008 / 09 Bilal Erkin & Jennifer Steinbach
  • 17. HIDDEN-MARKOV MODELLE - Ablauf MARKOV  Aussuchen eines Phonems und Vergleich mit dem Audiosignal  Wiederholdung, falls keine Übereinstimmung Computerlinguistik WS 2008 / 09 Bilal Erkin & Jennifer Steinbach
  • 18. HIDDEN-MARKOV MODELLE - Ablauf MARKOV  Ausgabe des Phonems bei Übereinstimmung O Computerlinguistik WS 2008 / 09 Bilal Erkin & Jennifer Steinbach
  • 19. HIDDEN-MARKOV MODELLE - Ablauf MARKOV  Übergang zum nächsten Zustand O Computerlinguistik WS 2008 / 09 Bilal Erkin & Jennifer Steinbach
  • 20. HIDDEN-MARKOV MODELLE - Ablauf MARKOV  Übergang zum nächsten Zustand O F E N Computerlinguistik WS 2008 / 09 Bilal Erkin & Jennifer Steinbach
  • 21. HIDDEN-MARKOV MODELLE – Ablauf MARKOV  HMMs können auch auf anderen Ebenen angewendet werden (Syntax, Semantik) O F E N Computerlinguistik WS 2008 / 09 Bilal Erkin & Jennifer Steinbach
  • 22. SYNTAKTISCHE / SEMANTISCHE ANALYSE  Syntaktische Analyse  Zulassung von Wörtern, die nur im Wörterbuch vorhanden sind  Vorgegebene Reihenfolge der Wörter (Grammatik)  Semantische Analyse  Erkennung der Satzstruktur Computerlinguistik WS 2008 / 09 Bilal Erkin & Jennifer Steinbach
  • 23. PERSPEKTIVEN  Keinen universellen Spracherkenner  Systeme für spezielle Anwendungen  Optimierung bei der Entfernung der Umgebungsgeräusche  Erkennung unbekannter Wörter Computerlinguistik WS 2008 / 09 Bilal Erkin & Jennifer Steinbach
  • 24. WINDOWS VISTA - SPRACHERKENNUNG • Windows Vista verfügt über leistungsstarke Sprachfeatures • Mit Hilfe dieser Sprachfeatures wird dem Anwender ermöglicht, den Computer statt mit der Tastatur oder der Maus mittels Sprachbefehlen zu steuern. • Die Spracherkennung unter Windows Vista ermöglicht die Interaktion mit dem Computer per Stimme. • Es können Dokumente und E E-Mail-Nachrichten in gängigen Anwendungen diktiert und Formulare im Internet mit Hilfe von Sprachbefehlen ausgefüllt werden. Computerlinguistik WS 2008 / 09 Bilal Erkin & Jennifer Steinbach
  • 25. SPRACHERKENNUNG - ENTWICKLUNG • Entwicklung von multilingualen Spracherkennungssystemen • Multilinguale Spracherkennungssysteme: o Dies sind Systeme, die für mehrere Sprachen gleichzeitig genutzt werden können. Vorteile: - man kann während des Diktiervorgangs zwischen den Sprachen wechseln Nachteile: - Entwicklung sehr kostspielig, da erst das gesamte Vokabular der jeweiligen Sprache erfasst werden muss - Entwicklungsdauer somit sehr lang - es gibt bis jetzt kein System, das diese Fähigkeiten aufweist Computerlinguistik WS 2008 / 09 Bilal Erkin & Jennifer Steinbach
  • 26. QUELLENNACHWEIS • http://digbib.ubka.uni-karlsruhe.de/volltexte/1000008467 karlsruhe.de/volltexte/1000008467 • http://www.lars-lehre.de/download/Vorlesung5.pdf • http://www.fh-wedel.de/~si/seminare/ss01/Ausarbeitung/a.sprache/gdlgsprerk12.htm wedel.de/~si/seminare/ss01/Ausarbeitung/a.sprache/gdlgsprerk12.htm • Vater, H. (1994): Einführung in die Sprachwissenschaft. München: Fink. • Carstensen, K.U., Ebert, C., Endriss, C., Jekat, S., Klabunde, R., Langer, H. (2004): Computerlinguistik und Sprachtechnologie. Eine Einführung (2. Auflage). Heidelberg, Berlin: Spektrum. • Euler, Stefan: Grundkurs Spracherkennung, Vieweg-Verlag, Wiesbaden, 2006. Verlag,  Mitkov, Ruslan (hrsg.): The Oxford handbook of computational linguistics, Oxford University Press, Oxford, 2005.  www8.informatik.uni-erlangen.de/IMMD8/Lectures/AI- -GAMES/SS2002/hs/vortraege/12062002/VoiceCCC.ppt  http://nats-www.informatik.uni-hamburg.de/~cri/MTPraktikum02_03/Paper_Signal/Slide006.html hamburg.de/~cri/MTPraktikum02_03/Paper_Signal/Slide006.html Computerlinguistik WS 2008 / 09 Bilal Erkin & Jennifer Steinbach