ESTADO DE MATO GROSSOFACULDADE DE CIÊNCIAS EXATASUNIVERSIDADE DO ESTADO DE MATO GROSSOCAMPUS UNIVERSITÁRIO DEP. EST. RENÊ ...
OBJETIVO<br />Estudar as ferramentas ou softwares que permitam a conversão de áudio para texto com a finalidade de facilit...
PROBLEMA<br />Como as ferramentas ou softwares que permitem a conversão de áudio para texto podem contribuir com a documen...
Principais Autores<br />ABRAHAMSSON, Pekka; SALO, Outi; RONKAINEN, Jussi; WARSTA, Juhani. Agile Software Development Metho...
MOTIVAÇÃO<br />Conhecer e estudar os diferentes softwares de conversão ou transcrição de áudio para texto e descobrir qual...
ESTRUTURA<br />Introdução<br />Capítulo I: Processos de Desenvolvimento de Software<br />Capítulo II: Reconhecimento de Vo...
Processo de Desenvolvimento de Software<br />CAPÍTULO I<br />7<br />Conversão de Áudio para Texto  Aplicada ao <br />Desen...
Processos Aplicados ao Software<br />Auxiliam a competitividade, qualidade e produtividade sistemática do software.<br />P...
Metodologias de Desenvolvimento de Software<br />Disciplinas com a finalidade de produzir diversos modelos do sistema .<br...
Metodologias de Desenvolvimento de Software (Cont.)<br />Modelo Clássico<br />Conjuntos de passos sequenciais a serem segu...
Metodologias de Desenvolvimento de Software (Cont.)<br />RationalUnifiedProcess(RUP) <br />Abordagem disciplinada de atrib...
Metodologias de Desenvolvimento de Software (Cont.)<br />Metodologias Ágeis<br />Efetuado de forma:<br />Incremental;<br /...
Metodologias de Desenvolvimento de Software (Cont.)<br />Extreme Programming(XP)<br />Equipes pequenas e médias, requisito...
Metodologias de Desenvolvimento de Software (Cont.)<br />Scrum<br />Produzir um sistema flexível, num ambiente propenso a ...
Levantamento de Requisitos<br />Descobrir as propriedades da aplicação, restrições, desempenho exigido para o bom funciona...
Reconhecimento de Voz<br />CAPÍTULO II<br />16<br />Conversão de Áudio para Texto  Aplicada ao <br />Desenvolvimento de So...
Introdução ao Reconhecimento de Voz<br />O reconhecimento de voz é uma importante área de aplicação de reconhecimento de p...
Breve Histórico do Reconhecimento de Voz<br />1950 - Primeiro esforço para arquitetar um sistema de reconhecimento de voz....
Breve Histórico do Reconhecimento de Voz (Cont.)<br />19<br />Em 1980 com o surgimento de inovações tecnológicas, o reconh...
Sistemas de Reconhecimento de Voz<br />20<br />Conversão de Áudio para Texto  Aplicada ao <br />Desenvolvimento de Softwar...
Sistemas de Reconhecimento de Voz (Cont.)<br />21<br />Conversão de Áudio para Texto  Aplicada ao <br />Desenvolvimento de...
Tipos de Sistemas de Reconhecimento de Voz<br />De Acordo com o Tipo de Enunciado<br />Reconhecedor de palavras isoladas.<...
Método Acústico-Fonético<br />Identificar as unidades fonéticas da fala e após a concatenação destas, reconhecer a fala.<b...
Dificuldades em Reconhecimento de Voz<br />Segundo Furui (2001):<br />Coarticulação e redução de problemas: o espectro de ...
Conversão de Áudio para Texto<br />CAPÍTULO III<br />25<br />Conversão de Áudio para Texto  Aplicada ao <br />Desenvolvime...
Softwares de Conversão de Áudio para Texto<br />WavetoText<br />Research Lab. Inc.<br />Beneficios:<br />Simplifica e otim...
Softwares de Conversão de Áudio para Texto (Cont.)<br />IBM ViaVoice<br />IBM – 1997	. <br />Versão português 1999. <br />...
Arquitetura única e completamente integrada.
Uma extensa base de idiomas.
Alta precisão de reconhecimento.
Amplo vocabulário para reconhecimento.</li></li></ul><li>Usabilidade dos Softwares na Coleta de Requisitos<br />Exemplific...
Usabilidade dos Softwares na Coleta de Requisitos (Cont.)<br />29<br />Conversão de Áudio para Texto  Aplicada ao <br />De...
Usabilidade dos Softwares na Coleta de Requisitos (Cont.)<br />IBM ViaVoice<br />30<br />Conversão de Áudio para Texto  Ap...
Resultados Obtidos<br />WavetoText<br />Total de palavras faladas: 121<br />Convertidas Corretamente:  35<br />Gráfico 1 –...
Próximos SlideShares
Carregando em…5
×

Conversão de áudio para texto...

6.001 visualizações

Publicada em

Apresentação de Monografia sobre Conversão de Áudio para Texto Aplicada a Metologias Ágeis

Publicada em: Tecnologia
0 comentários
2 gostaram
Estatísticas
Notas
  • Seja o primeiro a comentar

Sem downloads
Visualizações
Visualizações totais
6.001
No SlideShare
0
A partir de incorporações
0
Número de incorporações
3
Ações
Compartilhamentos
0
Downloads
0
Comentários
0
Gostaram
2
Incorporações 0
Nenhuma incorporação

Nenhuma nota no slide

Conversão de áudio para texto...

  1. 1. ESTADO DE MATO GROSSOFACULDADE DE CIÊNCIAS EXATASUNIVERSIDADE DO ESTADO DE MATO GROSSOCAMPUS UNIVERSITÁRIO DEP. EST. RENÊ BARBOURDEPARTAMENTO DE CIÊNCIA DA COMPUTAÇÃO<br />Conversão de Áudio para Texto<br />Aplicada<br />ao Desenvolvimento de Software<br />Acadêmico: Lenin Ernesto Abadié Otero<br />Orientador: Prof. M.Sc. Fernando Selleri Silva<br />Barra do Bugres - Julho de 2010<br />
  2. 2. OBJETIVO<br />Estudar as ferramentas ou softwares que permitam a conversão de áudio para texto com a finalidade de facilitar a documentação dos requisitos coletados durante o processo de desenvolvimento de software.<br />2<br />Conversão de Áudio para Texto Aplicada ao <br />Desenvolvimento de Software<br />
  3. 3. PROBLEMA<br />Como as ferramentas ou softwares que permitem a conversão de áudio para texto podem contribuir com a documentação de reuniões realizadas durante o processo de desenvolvimento de software?<br />3<br />Conversão de Áudio para Texto Aplicada ao <br />Desenvolvimento de Software<br />
  4. 4. Principais Autores<br />ABRAHAMSSON, Pekka; SALO, Outi; RONKAINEN, Jussi; WARSTA, Juhani. Agile Software Development Methods: Review and Analysis. VTT Publications 478. Oulu, Finland: VTT Publications, 2002.<br />PETERS, James F.; PEDRYCZ, Witold. Engenharia de Software: Teoria e Prática, 3ª Impressão. Rio de Janeiro: Elsevier, 2001.<br />RABINER, Lawrence; JUANG, Biing-Hwang. Fundamentals of Speech Recognition.Prectince-Hall International, Inc. EUA, 1993.<br />SOMMERVILLE, Ian. Engenharia de Software, Tradução Andre Mauricio Andrade, São Paulo: Addison Wesley, 2003.<br />4<br />Conversão de Áudio para Texto Aplicada ao <br />Desenvolvimento de Software<br />
  5. 5. MOTIVAÇÃO<br />Conhecer e estudar os diferentes softwares de conversão ou transcrição de áudio para texto e descobrir qual destes se adéqua melhor na utilização da geração da documentação dos requisitos durante o processo de desenvolvimento de software.<br />5<br />Conversão de Áudio para Texto Aplicada ao <br />Desenvolvimento de Software<br />
  6. 6. ESTRUTURA<br />Introdução<br />Capítulo I: Processos de Desenvolvimento de Software<br />Capítulo II: Reconhecimento de Voz<br />Capítulo III: Conversão de Áudio para Texto<br />Considerações Finais<br />6<br />Conversão de Áudio para Texto Aplicada ao <br />Desenvolvimento de Software<br />
  7. 7. Processo de Desenvolvimento de Software<br />CAPÍTULO I<br />7<br />Conversão de Áudio para Texto Aplicada ao <br />Desenvolvimento de Software<br />
  8. 8. Processos Aplicados ao Software<br />Auxiliam a competitividade, qualidade e produtividade sistemática do software.<br />Processo de Desenvolvimento de Software<br />Fases durante o desenvolvimento de software (IEEE 1074-1995):<br />De requisitos: o que o software deve fazer.<br />De projeto: como serão estabelecidas estruturas e funções do sistema.<br />De implementação: produção das linhas de comando.<br />8<br />Conversão de Áudio para Texto Aplicada ao <br />Desenvolvimento de Software<br />
  9. 9. Metodologias de Desenvolvimento de Software<br />Disciplinas com a finalidade de produzir diversos modelos do sistema .<br />Metodologias Tradicionais<br />Rigorosas: exatidão nas premissas e propostas, documentação detalhada.<br />Pesadas: grande quantidade de documentos.<br />9<br />Conversão de Áudio para Texto Aplicada ao <br />Desenvolvimento de Software<br />
  10. 10. Metodologias de Desenvolvimento de Software (Cont.)<br />Modelo Clássico<br />Conjuntos de passos sequenciais a serem seguidos.<br />Figura 1 – Estágios do Modelo Clássico ou Cascata<br />Fonte: Extraído de Sommerville (2003)<br />10<br />Conversão de Áudio para Texto Aplicada ao <br />Desenvolvimento de Software<br />
  11. 11. Metodologias de Desenvolvimento de Software (Cont.)<br />RationalUnifiedProcess(RUP) <br />Abordagem disciplinada de atribuir tarefas e responsabilidades.<br />Figura 2 – Ciclo de construção de uma versão usando o Modelo RUP<br />Fonte: Adaptado de Kruchten (2003)<br />11<br />Conversão de Áudio para Texto Aplicada ao <br />Desenvolvimento de Software<br />
  12. 12. Metodologias de Desenvolvimento de Software (Cont.)<br />Metodologias Ágeis<br />Efetuado de forma:<br />Incremental;<br />Colaborativa;<br />Direta;<br />Adaptativa.<br />12<br />Conversão de Áudio para Texto Aplicada ao <br />Desenvolvimento de Software<br />
  13. 13. Metodologias de Desenvolvimento de Software (Cont.)<br />Extreme Programming(XP)<br />Equipes pequenas e médias, requisitos vagos.<br />Figura 3 – Ciclo de Vida da Metodologia XP<br />Fonte: Extraído de Abrahamsson et al. (2002)<br />13<br />Conversão de Áudio para Texto Aplicada ao <br />Desenvolvimento de Software<br />
  14. 14. Metodologias de Desenvolvimento de Software (Cont.)<br />Scrum<br />Produzir um sistema flexível, num ambiente propenso a mudanças.<br />Existem reuniões diárias de acompanhamento.<br />14<br />Conversão de Áudio para Texto Aplicada ao <br />Desenvolvimento de Software<br />
  15. 15. Levantamento de Requisitos<br />Descobrir as propriedades da aplicação, restrições, desempenho exigido para o bom funcionamento do sistema. <br />Métodos utilizados:<br />Levantamento Orientado a Pontos de Vista.<br />Brainstorming.<br />JoinAplication Design (JAD).<br />Entrevistas.<br />15<br />Conversão de Áudio para Texto Aplicada ao <br />Desenvolvimento de Software<br />
  16. 16. Reconhecimento de Voz<br />CAPÍTULO II<br />16<br />Conversão de Áudio para Texto Aplicada ao <br />Desenvolvimento de Software<br />
  17. 17. Introdução ao Reconhecimento de Voz<br />O reconhecimento de voz é uma importante área de aplicação de reconhecimento de padrões. <br />17<br />Conversão de Áudio para Texto Aplicada ao <br />Desenvolvimento de Software<br />
  18. 18. Breve Histórico do Reconhecimento de Voz<br />1950 - Primeiro esforço para arquitetar um sistema de reconhecimento de voz.<br />1960 – As estratégias de reconhecimento de voz baseavam-se na segmentação do sinal acústico em fonemas. <br />Década de 1970, surgiu o DTW, protótipo predominador para reconhecimento de fala.<br />Dynamic Time Warping: Técnica para reconhecimento de padrões de voz.<br />18<br />Conversão de Áudio para Texto Aplicada ao <br />Desenvolvimento de Software<br />
  19. 19. Breve Histórico do Reconhecimento de Voz (Cont.)<br />19<br />Em 1980 com o surgimento de inovações tecnológicas, o reconhecimento de voz ganhou força.<br />Aparecimento das redes neurais artificiais.<br />Da década de 1990 até a atualidade, procura-se aperfeiçoar os estudos de reconhecimento de voz.<br />Conversão de Áudio para Texto Aplicada ao <br />Desenvolvimento de Software<br />
  20. 20. Sistemas de Reconhecimento de Voz<br />20<br />Conversão de Áudio para Texto Aplicada ao <br />Desenvolvimento de Software<br />* FC: Fala Contínua DL: Dependente do Locutor PI: Palavras Isoladas DL : Dependente do Locutor<br />Segundo Martins (1997) e Braga (2006) .<br />
  21. 21. Sistemas de Reconhecimento de Voz (Cont.)<br />21<br />Conversão de Áudio para Texto Aplicada ao <br />Desenvolvimento de Software<br />* FC: Fala Contínua DL: Dependente do LocutorPI: Palavras Isoladas DL : Dependente do Locutor<br />Segundo Martins (1997) e Braga (2006) .<br />
  22. 22. Tipos de Sistemas de Reconhecimento de Voz<br />De Acordo com o Tipo de Enunciado<br />Reconhecedor de palavras isoladas.<br />Reconhecedor de palavras conectadas.<br />Reconhecedor de fala contínua.<br />De Acordo com o Grau de Dependência do Locutor<br />Dependente do locutor.<br />Independente do locutor.<br />22<br />Conversão de Áudio para Texto Aplicada ao <br />Desenvolvimento de Software<br />
  23. 23. Método Acústico-Fonético<br />Identificar as unidades fonéticas da fala e após a concatenação destas, reconhecer a fala.<br />Método de Reconhecimento de Padrões<br />Sistemas treinados para reconhecer características específicas.<br />Método de Inteligência Artificial<br />Compilação e incorporação de uma multiplicidade de fontes de conhecimento para a solução do problema em mão. <br />Métodos de Reconhecimento de Voz<br />23<br />Conversão de Áudio para Texto Aplicada ao <br />Desenvolvimento de Software<br />
  24. 24. Dificuldades em Reconhecimento de Voz<br />Segundo Furui (2001):<br />Coarticulação e redução de problemas: o espectro de um fonema é influenciado por fonemas próximos.<br />Dificuldades na segmentação: não se tem uma forma de restrição dos fonemas.<br />Individualidade e outros problemas de variação: As características mudam de locutor para locutor.<br />Conhecimento linguístico insuficiente: quando as características físicas de fala não carregam suficiente informação fonética.<br />24<br />Conversão de Áudio para Texto Aplicada ao <br />Desenvolvimento de Software<br />
  25. 25. Conversão de Áudio para Texto<br />CAPÍTULO III<br />25<br />Conversão de Áudio para Texto Aplicada ao <br />Desenvolvimento de Software<br />
  26. 26. Softwares de Conversão de Áudio para Texto<br />WavetoText<br />Research Lab. Inc.<br />Beneficios:<br />Simplifica e otimiza o trabalho economizando tempo;<br />Suprime a necessidade de digitar discussões anotadas, comentários e memorandos;<br />Converte suas mensagens de voz em texto;<br />Figura 4 – Barra de opções do WavetoText v. 5.2<br />26<br />Conversão de Áudio para Texto Aplicada ao <br />Desenvolvimento de Software<br />
  27. 27. Softwares de Conversão de Áudio para Texto (Cont.)<br />IBM ViaVoice<br />IBM – 1997 . <br />Versão português 1999. <br />Taxa de acerto de 98%.<br />Figura 5 – Barra de Iniciação do IBM ViaVoice<br />27<br />Conversão de Áudio para Texto Aplicada ao <br />Desenvolvimento de Software<br /><ul><li>Características e Vantagens
  28. 28. Arquitetura única e completamente integrada.
  29. 29. Uma extensa base de idiomas.
  30. 30. Alta precisão de reconhecimento.
  31. 31. Amplo vocabulário para reconhecimento.</li></li></ul><li>Usabilidade dos Softwares na Coleta de Requisitos<br />Exemplificação de Uso do WavetoText<br />28<br />Conversão de Áudio para Texto Aplicada ao <br />Desenvolvimento de Software<br />Figura 6 – Janela para Treinamento do Software<br />Figura 7 – Janela para Gravação dos Requisitos<br />
  32. 32. Usabilidade dos Softwares na Coleta de Requisitos (Cont.)<br />29<br />Conversão de Áudio para Texto Aplicada ao <br />Desenvolvimento de Software<br />Figura 8 – Janela para Conversão de Áudio para Texto<br />
  33. 33. Usabilidade dos Softwares na Coleta de Requisitos (Cont.)<br />IBM ViaVoice<br />30<br />Conversão de Áudio para Texto Aplicada ao <br />Desenvolvimento de Software<br />Figura 9 – Janela do IBM ViaVoice integrada ao Microsfot Word<br />
  34. 34. Resultados Obtidos<br />WavetoText<br />Total de palavras faladas: 121<br />Convertidas Corretamente: 35<br />Gráfico 1 – Resultados dos testes de usabilidade do WavetoText<br />31<br />Conversão de Áudio para Texto Aplicada ao <br />Desenvolvimento de Software<br />
  35. 35. Resultados Obtidos (Cont.)<br />IBM ViaVoice<br />Total de palavras faladas: 150.<br />Transcritas corretamente: 131 palavras.<br />Gráfico 2 – Resultados do Teste de Usabilidade do IBM ViaVoice<br />32<br />Conversão de Áudio para Texto Aplicada ao <br />Desenvolvimento de Software<br />
  36. 36. Considerações Finais<br />Contribuição<br />Dificuldades encontradas<br />Trabalhos futuros<br />33<br />Conversão de Áudio para Texto Aplicada ao <br />Desenvolvimento de Software<br />
  37. 37. 34<br />Conversão de Áudio para Texto Aplicada ao <br />Desenvolvimento de Software<br />Perguntas?<br />

×