Influência do Contexto no
Reconhecimento de fala
Gabriel Ferreira Araujo
Orientador: Prof. Dr. Hendrik T. Macedo
Programa ...
Reconhecimento
Automático de Fala
Variabilidade devido…
- Tamanho do vocabulário
- Ambiguidade
- Condições adversas
- Rest...
Reconhecimento de fala
automático sensível ao
contexto
● Sensível ao contexto do
usuário e da aplicação
● Se adapta com mu...
Comoconstruir uma aplicação ASR?
Quais os passosa seguir?
Antes...
A maioria das aplicações
ASR são desenvolvidas de
forma Ad hoc
Modelo de processo
de desenvolvimento para
sistemas ASR
Eclipse Process Framework
● Engenharia de processos de software
● Suporta o desenvolvimento iterativo, ágil, e
incremental...
Open Unified Process
Processo de desenvolvimento
para sistemas ASR
● Outline
● Modeling
● Integration
Outline
Activity
Modeling
Activity
Build a text corpus
Build a speech corpus
Build a phonetic dictionary
Model the
language
Model the
Acoustic
Model the language/acoustic
Model the
context
Model the
semantics
Integration
Activity
Reconhecimento de fala
automático sensível ao
contexto
● Sensível ao contexto do
usuário e da aplicação
● Se adapta com mu...
Mas o que significa
contexto?
O que é informação contextual?
Um conceito mal definido. Vago.
Mais de 150 definições.
Inteligência Artificial
Documentação Ergonomia cognitiva
Psicologi...
“Contexto é qualquer informação
que pode ser usada para
caracterizar a situação de
uma entidade.”
— Anind K. Dey, 2001
Categorias de informações contextuais
— Zimmermann, Lorenz and Oppermann, 2007
Mas como lidamos com
tais informações?
Como podemos fazer uso disso
em nossa aplicação ASR?
Arquitetura do Toolkit de Contexto
— Dey, Abowd and Salber, 2001
Sistema ASR Adaptativo
Adaptação de modelo linguístico
estatístico
Arquitetura clássica ASR
ASR sensível ao contexto
Controle de navegação de
robôs móveis
- Interação em tempo real
- Interface baseada em fala
- Vocabulário restrito
- Coman...
Controle de navegação de
robôs móveis
Adaptação do modelo linguístico
guiada pelo contexto
Experimentos e Resultados
- Modelo linguístico 3-gram
- 4 modelos linguísticos diferentes
- 2 pesos de modelo diferentes
-...
Experimentos e Resultados
WER WIL
Conclusões
- Redução global nas taxas de erro
- Redução de até 3,3% na taxa WIL
- Maior nível de abstração
- Thesaurus
- G...
● SBIA - Qualis B2
○ “Context-sensitive ASR for controlling the
navigation of mobile robots”
● Journal of Computer Science...
Obrigado!
Perguntas?
Contato:
gabrielfa@dcomp.ufs.br and hendrik@ufs.br
Influência do Contexto no Reconhecimento de fala
Influência do Contexto no Reconhecimento de fala
Próximos SlideShares
Carregando em…5
×

Influência do Contexto no Reconhecimento de fala

652 visualizações

Publicada em

Como informações de contexto podem melhorar o reconhecimento de fala? Esta breve apresentação pode nos dar uma dica.

Publicada em: Tecnologia
0 comentários
0 gostaram
Estatísticas
Notas
  • Seja o primeiro a comentar

  • Seja a primeira pessoa a gostar disto

Sem downloads
Visualizações
Visualizações totais
652
No SlideShare
0
A partir de incorporações
0
Número de incorporações
432
Ações
Compartilhamentos
0
Downloads
0
Comentários
0
Gostaram
0
Incorporações 0
Nenhuma incorporação

Nenhuma nota no slide

Influência do Contexto no Reconhecimento de fala

  1. 1. Influência do Contexto no Reconhecimento de fala Gabriel Ferreira Araujo Orientador: Prof. Dr. Hendrik T. Macedo Programa de pós-graduação em ciência da computação Departamento de Computação Universidade Federal de Sergipe São Cristovão, Brazil
  2. 2. Reconhecimento Automático de Fala Variabilidade devido… - Tamanho do vocabulário - Ambiguidade - Condições adversas - Restrições de linguagem e tarefa - etc
  3. 3. Reconhecimento de fala automático sensível ao contexto ● Sensível ao contexto do usuário e da aplicação ● Se adapta com mudanças de contexto
  4. 4. Comoconstruir uma aplicação ASR? Quais os passosa seguir? Antes...
  5. 5. A maioria das aplicações ASR são desenvolvidas de forma Ad hoc
  6. 6. Modelo de processo de desenvolvimento para sistemas ASR
  7. 7. Eclipse Process Framework ● Engenharia de processos de software ● Suporta o desenvolvimento iterativo, ágil, e incremental ○ OpenUP/Basic ● Baseado na especificação SPEM 1.1 ○ Software Process Engineering Meta-Model ● Extensivo conjunto de ferramentas e conceitos
  8. 8. Open Unified Process
  9. 9. Processo de desenvolvimento para sistemas ASR ● Outline ● Modeling ● Integration
  10. 10. Outline Activity
  11. 11. Modeling Activity
  12. 12. Build a text corpus
  13. 13. Build a speech corpus
  14. 14. Build a phonetic dictionary
  15. 15. Model the language Model the Acoustic
  16. 16. Model the language/acoustic
  17. 17. Model the context
  18. 18. Model the semantics
  19. 19. Integration Activity
  20. 20. Reconhecimento de fala automático sensível ao contexto ● Sensível ao contexto do usuário e da aplicação ● Se adapta com mudanças de contexto
  21. 21. Mas o que significa contexto? O que é informação contextual?
  22. 22. Um conceito mal definido. Vago. Mais de 150 definições. Inteligência Artificial Documentação Ergonomia cognitiva Psicologia cognitiva Administração Linguística Filosofia
  23. 23. “Contexto é qualquer informação que pode ser usada para caracterizar a situação de uma entidade.” — Anind K. Dey, 2001
  24. 24. Categorias de informações contextuais — Zimmermann, Lorenz and Oppermann, 2007
  25. 25. Mas como lidamos com tais informações? Como podemos fazer uso disso em nossa aplicação ASR?
  26. 26. Arquitetura do Toolkit de Contexto — Dey, Abowd and Salber, 2001
  27. 27. Sistema ASR Adaptativo Adaptação de modelo linguístico estatístico
  28. 28. Arquitetura clássica ASR
  29. 29. ASR sensível ao contexto
  30. 30. Controle de navegação de robôs móveis - Interação em tempo real - Interface baseada em fala - Vocabulário restrito - Comandos pré-defindos comando = <ação> [precisão] [referência]
  31. 31. Controle de navegação de robôs móveis
  32. 32. Adaptação do modelo linguístico guiada pelo contexto
  33. 33. Experimentos e Resultados - Modelo linguístico 3-gram - 4 modelos linguísticos diferentes - 2 pesos de modelo diferentes - Informação contextual: presença e visibilidade - Lista de sinônimos - Word error rate (WER) - Word information lost (WIL)
  34. 34. Experimentos e Resultados WER WIL
  35. 35. Conclusões - Redução global nas taxas de erro - Redução de até 3,3% na taxa WIL - Maior nível de abstração - Thesaurus - Gramática probabilística
  36. 36. ● SBIA - Qualis B2 ○ “Context-sensitive ASR for controlling the navigation of mobile robots” ● Journal of Computer Science - Qualis B3 ○ “Parallel Implementation of Expectation- Maximization Algorithm for the Training of Gaussian Mixture Models” ● EATIS - Qualis B4 ○ “Context formalization and its use on dynamic adaptation of language model in ASR systems” Publicações
  37. 37. Obrigado! Perguntas? Contato: gabrielfa@dcomp.ufs.br and hendrik@ufs.br

×