SlideShare uma empresa Scribd logo
1 de 20
WDCOPIN 2012

Análise Acústica de patologias da fala
                         (VOICECLIN)
                         Mestrando Sérgio de Brito Espinola
                   Ciência da Computação – LAD/COPIN/UFCG
             Orientadores: Prof. Dr. Elmar Uwe Kurt Melcher,
           Prof. Dra. Joseana Macêdo Fechine Régis de Araújo
Agenda

   Contexto da Pesquisa
          Problema
          Relevância
          Motivação
   Objetivo
   Materiais e métodos
   Resultados Preliminares

   Considerações Finais e
    Trabalhos Futuros
                                          Fonte Figura microfone : Microsoft ® Office: mac, Clipart, HOME & STUDENT, 2011.

  Campina Grande, 8 de Maio de 2012   2                 Sérgio Espinola – LAD/COPIN/CEEI/UFCG
Voz, Economia e Sociedade

         Instrumento natural de Comunicação;
         Um terço (1/3) da força de trabalho produtiva
              depende da Voz para seus ofícios                 (FRAILE et ali 2009);



         Esses profissionais podem ser
              classificados em:      (SDERSTEN 2007)


                  Instrutores,
                  Intérpretes,
                  Persuasivos,
                  Profissionais de emergência.




Campina Grande, 8 de Maio de 2012                      3   F
                                                           Fonte Fotos: Religioso: http://www.pletz.com/blog e Aula: http://morgadodeontologia.blogspot.com
Voz, Economia e Sociedade II

 3 a 10% dos americanos terão
  algum problema relacionado a
  fala durantes suas vidas;
 ~60 % dos professores podem
  ter problemas de voz no Brasil
  (ZAMBOM; BEHLAU, 2010).                      “Em 29 de outubro, Lula foi diagnosticado com
                                               câncer de laringe após passar por exames no
                                               Hospital Sírio-Libanês, em São Paulo.”
                                               Revista Veja


                                             População de Professores PT-BR:
                                             •Cerca de 2,4 milhões (Educação Básica 2 mi)
                                             •Mulheres representam
                                              81,5 % do total amostrado




                                      Dados de 1651 professores da rede básica de ensino e
                                      1614 pessoas da população em geral
                                                            Dados MEC/INEP (ZAMBOM, BEHLAU 2010):
                                   Disponível em <http://www.rbep.inep.gov.br/index.php/RBEP/article/viewFile/474/487>
                                                                                                    Reportagem sobre Lula:
                            4                <http://veja.abril.com.br/noticia/brasil/lula-divulga-foto-sem-barba-e-cabelo>
Problema na Voz e
Questões sobre seu Diagnóstico

 Procedimentos
  1. Paciente: Procurar Otorrino ou Fonoaudiólogo;

  2. Especialista médico deverá:
        Escutar diretamente a voz do paciente;
        Inspecionar (direta ou indireta) por meio de
         exames das pregas vocais.


+Considerações Levantadas
  1. Análises subjetivas (experiência do especialista).
      Imprecisão e ambiguidade nos diagnósticos!
  2. Exames são custosos (equipamentos e reagentes) /desagradáveis
     (invasivos).
      Falta de estímulo ou declínio total para consulta e constrangimentos!
                                                Fonte Figura microfone: Microsoft ® Office: mac, Clipart, HOME & STUDENT, 2011.
                                       5                      Fonte Figura exame: http://midwestearnosethroat.com/services/throat
Objetivo




              Modelar um sistema para apoiar o
              Diagnóstico Clínico da Voz (Voice),
                  por meio da análise acústica,
                 para identificar um conjunto de
                                patologias da fala
Campina Grande, 8 de Maio de 2012   6
Estudo

 Caracterização de um Sistema de Processamento digital de
 sinais de Voz (PDSV) para classificação automática de um
 conjunto de Patologias Vocais.

                                                               Terapia vocal,
                                                               cirurgia e, em
                                                               alguns casos,
                                                                radioterapia
                                                              (MARTINEZ & RUFINER, 2000).

                                                Indicar um
                                                Diagnóstico
         Fala do                                (Patologia)
         Paciente

                                    VOICECLIN

Campina Grande, 8 de Maio de 2012               7             Sérgio Espinola – LAD/UFCG
Motivação

         1. Diagnóstico precoce - quase sempre –
                é favorável à recuperação do paciente;
                                Chances de cura (carcinoma na laringe *):
                                •Tumor em estágio inicial                                                – acima de 90%
                                •“             “          médio                                          – de 40% a 70%
                                •“             “           avançado                                      – abaixo de 20%


         1. Sinalizar um diagnóstico por meio de uma
                gravação local (própria voz) pode alcançar um
                grande público.
                Exemplo: Sistema em Computador ou num dispositivo portátil (celular,
                smartphone ou tablet).

                * Fonte: http://g1.globo.com/bemestar/noticia/2011/10/cancer-de-laringe-que-atinge-lula-acomete-5-homens-para-cada-mulher.html
                                                                                                  Sérgio Espinola – LAD / COPIN / UFCG
Campina Grande, 12 de dezembro de 2011                                8                                        sergiodbe@lad.dsc.ufcg.edu.br
Motivação II

           1. Não existe ainda um consenso dos cientistas
                  a respeito da:
                 Modelagem mais “apropriada” para caracterizar uma
                  determinada patologia;
                 Definição dos descritores acústicos (Fo, Pitch, etc)
                  “bons” na discriminação de determinada (s) Patologia
                  (s);
           2. Acesso a uma base de dados relevante e
                  também usada por outros pesquisadores no
                  Mundo.

                                                   Sérgio Espinola – LAD / COPIN / UFCG
Campina Grande, 12 de dezembro de 2011   9                   sergiodbe@lad.dsc.ufcg.edu.br
Materiais e Métodos I
                                                         Figura 2. 5 - Modelo do trato vocal ( RAB I NER and S CHAFER , 1978) .




                                                     O trato nasal começa na úvula e termina nas narinas. Quando a úvula é


 Objetos da pesquisa:
                                               abaixada, o trato nasal é acusticamente acoplado ao trato vocal para produzir os
                                               sons nasais da voz.    Na Figura 2.6, é apresentado um diagrama em blocos da
                                               produção de voz humana (DELLER, PROAKIS & HANSEN, 1993), também
   Exame da Fala (Voz):                       denominado sistema fonte-filtro, em que as dobras vocais são consideradas a


       fonema /a/ gravado,
                                               fonte sonora e o trato vocal, o filtro. Nesse modelo, as saídas produzem ondas
                                               acústicas que representam a voz humana (RABINER e JUANG, 1993).

   Diagnósticos de Patologias.

É Necessário citar o
  Contexto da Produção da Voz
     Está relacionado à Laringe, faringe, língua,
      palato, lábios e às estruturas relacionadas
      (pulmão, pregas ou dobras vocais, etc).
     A articulação destes mecanismos/estruturas
      produz sons particulares que, de forma
      simplificada, serão tratados como vozes.


                                                         Figura 2. 6 - Um diagrama de blocos da produção de voz humana.
                                                         Figura UM DIAGRAMA DE BLOCOS DA PRODUÇÃO DA VOZ HUMANA
                                                                                                              (COSTA, 2008)

                                             10
Materiais e Métodos II

       Base: 209 Vozes
              Gravação da Fonação da
                    Vogal sustentada a
              Duração média: 1-3 s
              Sexo: F=136; M=73
              Respaldo: Estudo de profissionais
                   médicos e especialistas em voz do
                   Hospital-Enfermaria de Olhos, Ouvido e
                   Garganta de Massachusetts/USA MEEI
                   (KAY, 1994)




Fonte Figura WORKSHOP ON ACOUSTIC ANALYSIS, TITZE, Ingo R. PH.D. Page 9.   11
as part of a cycle to cycle least squared error comparison.
                                                                           A cyclic parameter contour is a time series of any cyclic parameter (e.g., F o cont
                                                                  tude contour, open quotient contour). For periodic signals, the contour is a constant, by
                                                                  For aperiodic signals, the cyclic parameter contour can take on many different shapes, b


Materiais e Métodos III
                                                                  signal of its own. Figure 2 shows an Fo contour extracted from a voice signal (top curv
                                                                  contour is highly magnified to show the finest detail in perturbation. The subject (no
                                                                  sustained an [b ] vowel as steady as he could for about 12 seconds at a mid-range value
                                                                  The target Fo was 98 Hz, a G2 on the keyboard. Time is labeled in number of cycles (
                                                                  instead of seconds because 1 point is plotted for every cycle of vocal fold vibration. N
                                                                  range of frequency variation is 96.7 Hz to 102.4 Hz, about ±3%, but this range is attribute




 Análise Acústica
      Definição,
      Representação da Voz,
      Qualidade Vocal,
      Descritores Acústicos


 Ferramentas
      AA: WaveSurfer, Praat;
       Edição de Áudio: Audacity;
                                                                                                                                                           Fig
                                                                                                                                                          fu
                                                                                                                                                           fre
      Software Estatístico: R, Matlab ©;                                                                                                                  (Fo
                                                                                                                                                           us
                                                                                                                                                           pe
      Classificação e Testes: WEKA ©, Java ©;                                                                                                             an
                                                                                                                                                           su

       Planilhas: Excel ©, LibreOffice.
                                                                                                                                                           no
                                                                                                                                                          ma
                                                                                                                                                           na
                                                                                                                                                           ste
                                                                                                                                                           vo
                                                                                                                                                           ap
                                                                                                                                                           ma
                                                                                                                                                           fo r
                                                                                                                                                           se

      Fonte Figura WORKSHOP ON ACOUSTIC ANALYSIS.. Page 9.   12
                                                                                                                                                     SUM M ARY
Resultados Preliminares I

        Diagnósticos Confirmados
        com especialista:
              1. Normal
              2.   Patologias (dez)




Campina Grande, 8 de Maio de 2012     13   Sérgio Espinola – LAD/COPIN/CEEI/UFCG
Resultados Preliminares II

        1.     Estudos de Caso (UC)
              I.    UC1: Da Presença de Patologias
                     “Normal X Patológica”:
                    Sucesso esperado (Cerca de 100% de CA)!
                     A não-normalidade na produção da fala (patologia) está associada ao
                    aparecimento da não-estacionariedade do sinal produzido na fonação sustentada.
                    Efeitos: Mudanças de Amplitude, ruído de turbulência, etc.


              II. UC2: Dentre Patologias,
                    Identificar qual está presente na fala.
                   Sucesso de cerca de 60% (ainda baixo).
                   Classificador: Redes neurais Artificiais, MLP,
                   Diversas configurações testadas.

        2.     Protótipo de Aplicação de voz no
               iPhone/iPad (c): registro e armazenamento
               da fala.
Campina Grande, 8 de Maio de 2012                              14
Validação: Exemplo

 Descritor acústico
 Separação de Vozes Normais() / Patológicas() (y=60%)




                              15
                                           Sérgio Espinola – LAD/COPIN/CEEI/UFCG
Validação II: Contraexemplo

     Frequência
          Fundamental Média: Fo
     Descritor não útil para a
      Classificação Pretendida.
     Uma Linha não separa
       Normal / Patológica !
       Para todas vozes, eixo X,
       variação de Fo é a mesma
       (entre 60 Hz e 350 Hz).




                                         Normais   Patológicas




Campina Grande, 8 de Maio de 2012   16                Sérgio Espinola – LAD/COPIN/CEEI/UFCG
Considerações Finais

         Após a análise e confirmação recente (abril) dos
             diagnósticos das Patologias por especialista médico,
             a pesquisa segue em novo ritmo de decobertas e
             resultados;
         O Foco passou para a investigação
             estatística/inferencial, análise multivariada dos
             fatores (cerca de 20 descritores acústicos), técnicas
             de PDSV e de Inteligência Artificial para a separação
             das classes de patologias pretendidas, etc.


                                                Sérgio Espinola – LAD / COPIN / UFCG
Campina Grande, 12 de dezembro de 2011   17               sergiodbe@lad.dsc.ufcg.edu.br
Validação em Curso:
Análise de Componentes Principais                     (PCA)



 Objetivos:
   Identificar as principais fontes de variação
     de dados complexos (muitas variáveis);
   Tornar as informações interpretáveis
     (gráficos simples): Ex. Pareto.




                                                    Comp. {1-2} podem
                                                   explicar quase 65% da
                                                     variabilidade total
                                                     v




                                       18
Trabalhos Futuros

  Finalizar o Relatório com Síntese dos
   Experimentos e Gráficos da PCA anterior;
  Cruzar as Análises PCA;
    Conhecer “bem” a influência estatística desses descritores acústicos
      para classificação;
      Leia-se matematicamente efetivo para as métricas de sucesso.

    Revalidar com alguns desses melhores;




                                             19
Obrigado!

                                                                                    “A voz revela, lá do
                                                                                     mais recôndito do
                                                                                    ser, nossa condição
                                                                                      primeira, nossa
                                                                                    autenticidade maior
                                                                                         e a sonora
                                                                                    expressão da nossa
                                                                                    verdade” Edmée Brandi
                                                                                              E


                  Mestrando: Sérgio de Brito Espinola
                         Ciência da Computação LAD/COPIN/UFCG
                                    Contatos: sergiodbe@lad.dsc.ufcg.edu.br
                                                     http://twitter.com/sergiodbe




                                                          20                                LAD/COPIN/CEEI/UFCG
Campina Grande, 8 de Maio de 2012

Mais conteúdo relacionado

Destaque

Noche europea de los investigadores web
Noche europea de los investigadores webNoche europea de los investigadores web
Noche europea de los investigadores webJorge Barrios Muriel
 
Apresentação workshop lean + tdabc eseig maio 2011
Apresentação workshop lean + tdabc eseig maio 2011Apresentação workshop lean + tdabc eseig maio 2011
Apresentação workshop lean + tdabc eseig maio 2011Miguel Montenegro Araujo
 
Presentation2 distribute
Presentation2 distributePresentation2 distribute
Presentation2 distributelauren56
 
13A MalloryBohn Final Portfolio
13A MalloryBohn Final Portfolio13A MalloryBohn Final Portfolio
13A MalloryBohn Final PortfolioMallory Bohn
 
Using instagram to market your business
Using instagram to market your businessUsing instagram to market your business
Using instagram to market your businesskapil420
 
presentation project Vabea EN EMB
presentation project Vabea EN EMBpresentation project Vabea EN EMB
presentation project Vabea EN EMBThomas Pfeiffer
 

Destaque (7)

Noche europea de los investigadores web
Noche europea de los investigadores webNoche europea de los investigadores web
Noche europea de los investigadores web
 
Apresentação workshop lean + tdabc eseig maio 2011
Apresentação workshop lean + tdabc eseig maio 2011Apresentação workshop lean + tdabc eseig maio 2011
Apresentação workshop lean + tdabc eseig maio 2011
 
Presentation2 distribute
Presentation2 distributePresentation2 distribute
Presentation2 distribute
 
13A MalloryBohn Final Portfolio
13A MalloryBohn Final Portfolio13A MalloryBohn Final Portfolio
13A MalloryBohn Final Portfolio
 
Using instagram to market your business
Using instagram to market your businessUsing instagram to market your business
Using instagram to market your business
 
M1 jan 2017
M1 jan 2017M1 jan 2017
M1 jan 2017
 
presentation project Vabea EN EMB
presentation project Vabea EN EMBpresentation project Vabea EN EMB
presentation project Vabea EN EMB
 

Semelhante a Análise Acústica de patologias da fala (VOICECLIN)

Livro Pact e suas Disfunções.pdf
Livro Pact e suas Disfunções.pdfLivro Pact e suas Disfunções.pdf
Livro Pact e suas Disfunções.pdfTamirisAlves25
 
Condições de saúde auditiva no trabalho
Condições de saúde auditiva no trabalhoCondições de saúde auditiva no trabalho
Condições de saúde auditiva no trabalhoCosmo Palasio
 
Perda auditiva na_infancia 2012
Perda auditiva na_infancia 2012Perda auditiva na_infancia 2012
Perda auditiva na_infancia 2012Arquivo-FClinico
 
Artigo - INTERVENÇÃO FONOAUDIOLÓGICA PARA CONSULTORES EM UM SERVIÇO DE TELEAT...
Artigo - INTERVENÇÃO FONOAUDIOLÓGICA PARA CONSULTORES EM UM SERVIÇO DE TELEAT...Artigo - INTERVENÇÃO FONOAUDIOLÓGICA PARA CONSULTORES EM UM SERVIÇO DE TELEAT...
Artigo - INTERVENÇÃO FONOAUDIOLÓGICA PARA CONSULTORES EM UM SERVIÇO DE TELEAT...saude2010
 
Bisfenol A Parecer Jul 09
Bisfenol A Parecer Jul 09Bisfenol A Parecer Jul 09
Bisfenol A Parecer Jul 09Ecotv Strallos
 
O que há de novo na avaliação auditiva em crianças
O que há de novo na avaliação auditiva em criançasO que há de novo na avaliação auditiva em crianças
O que há de novo na avaliação auditiva em criançasgisa_legal
 
TCC - Hábitos Auditivos
TCC - Hábitos AuditivosTCC - Hábitos Auditivos
TCC - Hábitos AuditivosLívia Soares
 
parâmetros espectrais da voz
parâmetros espectrais da vozparâmetros espectrais da voz
parâmetros espectrais da vozAlejandro Rondón
 
Como preparar um Painel Científico (BANNER)
Como preparar um Painel Científico (BANNER)Como preparar um Painel Científico (BANNER)
Como preparar um Painel Científico (BANNER)Valquiria1003
 
Interface da Equipe da Biopsicossocial com as Regionais
Interface da Equipe da Biopsicossocial com as RegionaisInterface da Equipe da Biopsicossocial com as Regionais
Interface da Equipe da Biopsicossocial com as RegionaisSCPMSOSEPLAG
 
Esporotricose Humana A culpa não é do gato
Esporotricose Humana A culpa não é do gatoEsporotricose Humana A culpa não é do gato
Esporotricose Humana A culpa não é do gatoAlexandre Naime Barbosa
 
Intervenção do fonoaudiológo em Perdas auditivas unilaterais-em-crianças
Intervenção do fonoaudiológo em Perdas auditivas unilaterais-em-criançasIntervenção do fonoaudiológo em Perdas auditivas unilaterais-em-crianças
Intervenção do fonoaudiológo em Perdas auditivas unilaterais-em-criançasNayara Querino
 
Hepatite C - Epidemiologia, Triagem e Manejo para Médicos
Hepatite C - Epidemiologia, Triagem e Manejo para MédicosHepatite C - Epidemiologia, Triagem e Manejo para Médicos
Hepatite C - Epidemiologia, Triagem e Manejo para MédicosAlexandre Naime Barbosa
 
Apresentação geral sobre o tema: telemedicina e telessaúde
Apresentação geral sobre o tema: telemedicina e telessaúdeApresentação geral sobre o tema: telemedicina e telessaúde
Apresentação geral sobre o tema: telemedicina e telessaúdePaulo Lopes
 

Semelhante a Análise Acústica de patologias da fala (VOICECLIN) (20)

Livro Pact e suas Disfunções.pdf
Livro Pact e suas Disfunções.pdfLivro Pact e suas Disfunções.pdf
Livro Pact e suas Disfunções.pdf
 
Condições de saúde auditiva no trabalho
Condições de saúde auditiva no trabalhoCondições de saúde auditiva no trabalho
Condições de saúde auditiva no trabalho
 
07
0707
07
 
Perda auditiva na_infancia 2012
Perda auditiva na_infancia 2012Perda auditiva na_infancia 2012
Perda auditiva na_infancia 2012
 
CONTAMINAÇÃO TOXICA
CONTAMINAÇÃO TOXICACONTAMINAÇÃO TOXICA
CONTAMINAÇÃO TOXICA
 
Artigo (1)
Artigo (1)Artigo (1)
Artigo (1)
 
Monografiade cyndiae nadia
Monografiade cyndiae nadiaMonografiade cyndiae nadia
Monografiade cyndiae nadia
 
Artigo - INTERVENÇÃO FONOAUDIOLÓGICA PARA CONSULTORES EM UM SERVIÇO DE TELEAT...
Artigo - INTERVENÇÃO FONOAUDIOLÓGICA PARA CONSULTORES EM UM SERVIÇO DE TELEAT...Artigo - INTERVENÇÃO FONOAUDIOLÓGICA PARA CONSULTORES EM UM SERVIÇO DE TELEAT...
Artigo - INTERVENÇÃO FONOAUDIOLÓGICA PARA CONSULTORES EM UM SERVIÇO DE TELEAT...
 
Bisfenol A Parecer Jul 09
Bisfenol A Parecer Jul 09Bisfenol A Parecer Jul 09
Bisfenol A Parecer Jul 09
 
O que há de novo na avaliação auditiva em crianças
O que há de novo na avaliação auditiva em criançasO que há de novo na avaliação auditiva em crianças
O que há de novo na avaliação auditiva em crianças
 
TCC - Hábitos Auditivos
TCC - Hábitos AuditivosTCC - Hábitos Auditivos
TCC - Hábitos Auditivos
 
parâmetros espectrais da voz
parâmetros espectrais da vozparâmetros espectrais da voz
parâmetros espectrais da voz
 
Como preparar um Painel Científico (BANNER)
Como preparar um Painel Científico (BANNER)Como preparar um Painel Científico (BANNER)
Como preparar um Painel Científico (BANNER)
 
Interface da Equipe da Biopsicossocial com as Regionais
Interface da Equipe da Biopsicossocial com as RegionaisInterface da Equipe da Biopsicossocial com as Regionais
Interface da Equipe da Biopsicossocial com as Regionais
 
Esporotricose Humana A culpa não é do gato
Esporotricose Humana A culpa não é do gatoEsporotricose Humana A culpa não é do gato
Esporotricose Humana A culpa não é do gato
 
Intervenção do fonoaudiológo em Perdas auditivas unilaterais-em-crianças
Intervenção do fonoaudiológo em Perdas auditivas unilaterais-em-criançasIntervenção do fonoaudiológo em Perdas auditivas unilaterais-em-crianças
Intervenção do fonoaudiológo em Perdas auditivas unilaterais-em-crianças
 
Hepatite C - Epidemiologia, Triagem e Manejo para Médicos
Hepatite C - Epidemiologia, Triagem e Manejo para MédicosHepatite C - Epidemiologia, Triagem e Manejo para Médicos
Hepatite C - Epidemiologia, Triagem e Manejo para Médicos
 
Eventos DAP - outubro 2011
Eventos DAP - outubro 2011Eventos DAP - outubro 2011
Eventos DAP - outubro 2011
 
Apresentação geral sobre o tema: telemedicina e telessaúde
Apresentação geral sobre o tema: telemedicina e telessaúdeApresentação geral sobre o tema: telemedicina e telessaúde
Apresentação geral sobre o tema: telemedicina e telessaúde
 
Artigo - Novas Tecnologias de Imagem na Odontologia
Artigo - Novas Tecnologias de Imagem na OdontologiaArtigo - Novas Tecnologias de Imagem na Odontologia
Artigo - Novas Tecnologias de Imagem na Odontologia
 

Último

Avanços da Telemedicina em dados | Regiane Spielmann
Avanços da Telemedicina em dados | Regiane SpielmannAvanços da Telemedicina em dados | Regiane Spielmann
Avanços da Telemedicina em dados | Regiane SpielmannRegiane Spielmann
 
Em um local de crime com óbito muitas perguntas devem ser respondidas. Quem é...
Em um local de crime com óbito muitas perguntas devem ser respondidas. Quem é...Em um local de crime com óbito muitas perguntas devem ser respondidas. Quem é...
Em um local de crime com óbito muitas perguntas devem ser respondidas. Quem é...DL assessoria 31
 
HIV-Gastrointestinal....infeccao.....I.ppt
HIV-Gastrointestinal....infeccao.....I.pptHIV-Gastrointestinal....infeccao.....I.ppt
HIV-Gastrointestinal....infeccao.....I.pptAlberto205764
 
700740332-0601-TREINAMENTO-LAVIEEN-2021-1.pdf
700740332-0601-TREINAMENTO-LAVIEEN-2021-1.pdf700740332-0601-TREINAMENTO-LAVIEEN-2021-1.pdf
700740332-0601-TREINAMENTO-LAVIEEN-2021-1.pdfMichele Carvalho
 
Inteligência Artificial na Saúde - A Próxima Fronteira.pdf
Inteligência Artificial na Saúde - A Próxima Fronteira.pdfInteligência Artificial na Saúde - A Próxima Fronteira.pdf
Inteligência Artificial na Saúde - A Próxima Fronteira.pdfMedTechBiz
 
aula entrevista avaliação exame do paciente.ppt
aula entrevista avaliação exame do paciente.pptaula entrevista avaliação exame do paciente.ppt
aula entrevista avaliação exame do paciente.pptDaiana Moreira
 
88888888888888888888888888888663342.pptx
88888888888888888888888888888663342.pptx88888888888888888888888888888663342.pptx
88888888888888888888888888888663342.pptxLEANDROSPANHOL1
 
Fisiologia da Digestão sistema digestiv
Fisiologia da Digestão sistema digestivFisiologia da Digestão sistema digestiv
Fisiologia da Digestão sistema digestivProfessorThialesDias
 

Último (8)

Avanços da Telemedicina em dados | Regiane Spielmann
Avanços da Telemedicina em dados | Regiane SpielmannAvanços da Telemedicina em dados | Regiane Spielmann
Avanços da Telemedicina em dados | Regiane Spielmann
 
Em um local de crime com óbito muitas perguntas devem ser respondidas. Quem é...
Em um local de crime com óbito muitas perguntas devem ser respondidas. Quem é...Em um local de crime com óbito muitas perguntas devem ser respondidas. Quem é...
Em um local de crime com óbito muitas perguntas devem ser respondidas. Quem é...
 
HIV-Gastrointestinal....infeccao.....I.ppt
HIV-Gastrointestinal....infeccao.....I.pptHIV-Gastrointestinal....infeccao.....I.ppt
HIV-Gastrointestinal....infeccao.....I.ppt
 
700740332-0601-TREINAMENTO-LAVIEEN-2021-1.pdf
700740332-0601-TREINAMENTO-LAVIEEN-2021-1.pdf700740332-0601-TREINAMENTO-LAVIEEN-2021-1.pdf
700740332-0601-TREINAMENTO-LAVIEEN-2021-1.pdf
 
Inteligência Artificial na Saúde - A Próxima Fronteira.pdf
Inteligência Artificial na Saúde - A Próxima Fronteira.pdfInteligência Artificial na Saúde - A Próxima Fronteira.pdf
Inteligência Artificial na Saúde - A Próxima Fronteira.pdf
 
aula entrevista avaliação exame do paciente.ppt
aula entrevista avaliação exame do paciente.pptaula entrevista avaliação exame do paciente.ppt
aula entrevista avaliação exame do paciente.ppt
 
88888888888888888888888888888663342.pptx
88888888888888888888888888888663342.pptx88888888888888888888888888888663342.pptx
88888888888888888888888888888663342.pptx
 
Fisiologia da Digestão sistema digestiv
Fisiologia da Digestão sistema digestivFisiologia da Digestão sistema digestiv
Fisiologia da Digestão sistema digestiv
 

Análise Acústica de patologias da fala (VOICECLIN)

  • 1. WDCOPIN 2012 Análise Acústica de patologias da fala (VOICECLIN) Mestrando Sérgio de Brito Espinola Ciência da Computação – LAD/COPIN/UFCG Orientadores: Prof. Dr. Elmar Uwe Kurt Melcher, Prof. Dra. Joseana Macêdo Fechine Régis de Araújo
  • 2. Agenda Contexto da Pesquisa Problema Relevância Motivação Objetivo Materiais e métodos Resultados Preliminares Considerações Finais e Trabalhos Futuros Fonte Figura microfone : Microsoft ® Office: mac, Clipart, HOME & STUDENT, 2011. Campina Grande, 8 de Maio de 2012 2 Sérgio Espinola – LAD/COPIN/CEEI/UFCG
  • 3. Voz, Economia e Sociedade  Instrumento natural de Comunicação;  Um terço (1/3) da força de trabalho produtiva depende da Voz para seus ofícios (FRAILE et ali 2009);  Esses profissionais podem ser classificados em: (SDERSTEN 2007)  Instrutores,  Intérpretes,  Persuasivos,  Profissionais de emergência. Campina Grande, 8 de Maio de 2012 3 F Fonte Fotos: Religioso: http://www.pletz.com/blog e Aula: http://morgadodeontologia.blogspot.com
  • 4. Voz, Economia e Sociedade II  3 a 10% dos americanos terão algum problema relacionado a fala durantes suas vidas;  ~60 % dos professores podem ter problemas de voz no Brasil (ZAMBOM; BEHLAU, 2010). “Em 29 de outubro, Lula foi diagnosticado com câncer de laringe após passar por exames no Hospital Sírio-Libanês, em São Paulo.” Revista Veja População de Professores PT-BR: •Cerca de 2,4 milhões (Educação Básica 2 mi) •Mulheres representam 81,5 % do total amostrado Dados de 1651 professores da rede básica de ensino e 1614 pessoas da população em geral Dados MEC/INEP (ZAMBOM, BEHLAU 2010): Disponível em <http://www.rbep.inep.gov.br/index.php/RBEP/article/viewFile/474/487> Reportagem sobre Lula: 4 <http://veja.abril.com.br/noticia/brasil/lula-divulga-foto-sem-barba-e-cabelo>
  • 5. Problema na Voz e Questões sobre seu Diagnóstico  Procedimentos 1. Paciente: Procurar Otorrino ou Fonoaudiólogo; 2. Especialista médico deverá:  Escutar diretamente a voz do paciente;  Inspecionar (direta ou indireta) por meio de exames das pregas vocais. +Considerações Levantadas 1. Análises subjetivas (experiência do especialista).  Imprecisão e ambiguidade nos diagnósticos! 2. Exames são custosos (equipamentos e reagentes) /desagradáveis (invasivos).  Falta de estímulo ou declínio total para consulta e constrangimentos! Fonte Figura microfone: Microsoft ® Office: mac, Clipart, HOME & STUDENT, 2011. 5 Fonte Figura exame: http://midwestearnosethroat.com/services/throat
  • 6. Objetivo Modelar um sistema para apoiar o Diagnóstico Clínico da Voz (Voice), por meio da análise acústica, para identificar um conjunto de patologias da fala Campina Grande, 8 de Maio de 2012 6
  • 7. Estudo Caracterização de um Sistema de Processamento digital de sinais de Voz (PDSV) para classificação automática de um conjunto de Patologias Vocais. Terapia vocal, cirurgia e, em alguns casos, radioterapia (MARTINEZ & RUFINER, 2000). Indicar um Diagnóstico Fala do (Patologia) Paciente VOICECLIN Campina Grande, 8 de Maio de 2012 7 Sérgio Espinola – LAD/UFCG
  • 8. Motivação 1. Diagnóstico precoce - quase sempre – é favorável à recuperação do paciente; Chances de cura (carcinoma na laringe *): •Tumor em estágio inicial – acima de 90% •“ “ médio – de 40% a 70% •“ “ avançado – abaixo de 20% 1. Sinalizar um diagnóstico por meio de uma gravação local (própria voz) pode alcançar um grande público. Exemplo: Sistema em Computador ou num dispositivo portátil (celular, smartphone ou tablet). * Fonte: http://g1.globo.com/bemestar/noticia/2011/10/cancer-de-laringe-que-atinge-lula-acomete-5-homens-para-cada-mulher.html Sérgio Espinola – LAD / COPIN / UFCG Campina Grande, 12 de dezembro de 2011 8 sergiodbe@lad.dsc.ufcg.edu.br
  • 9. Motivação II 1. Não existe ainda um consenso dos cientistas a respeito da:  Modelagem mais “apropriada” para caracterizar uma determinada patologia;  Definição dos descritores acústicos (Fo, Pitch, etc) “bons” na discriminação de determinada (s) Patologia (s); 2. Acesso a uma base de dados relevante e também usada por outros pesquisadores no Mundo. Sérgio Espinola – LAD / COPIN / UFCG Campina Grande, 12 de dezembro de 2011 9 sergiodbe@lad.dsc.ufcg.edu.br
  • 10. Materiais e Métodos I Figura 2. 5 - Modelo do trato vocal ( RAB I NER and S CHAFER , 1978) . O trato nasal começa na úvula e termina nas narinas. Quando a úvula é  Objetos da pesquisa: abaixada, o trato nasal é acusticamente acoplado ao trato vocal para produzir os sons nasais da voz. Na Figura 2.6, é apresentado um diagrama em blocos da produção de voz humana (DELLER, PROAKIS & HANSEN, 1993), também  Exame da Fala (Voz): denominado sistema fonte-filtro, em que as dobras vocais são consideradas a fonema /a/ gravado, fonte sonora e o trato vocal, o filtro. Nesse modelo, as saídas produzem ondas acústicas que representam a voz humana (RABINER e JUANG, 1993).  Diagnósticos de Patologias. É Necessário citar o Contexto da Produção da Voz  Está relacionado à Laringe, faringe, língua, palato, lábios e às estruturas relacionadas (pulmão, pregas ou dobras vocais, etc).  A articulação destes mecanismos/estruturas produz sons particulares que, de forma simplificada, serão tratados como vozes. Figura 2. 6 - Um diagrama de blocos da produção de voz humana. Figura UM DIAGRAMA DE BLOCOS DA PRODUÇÃO DA VOZ HUMANA (COSTA, 2008) 10
  • 11. Materiais e Métodos II  Base: 209 Vozes  Gravação da Fonação da Vogal sustentada a  Duração média: 1-3 s  Sexo: F=136; M=73  Respaldo: Estudo de profissionais médicos e especialistas em voz do Hospital-Enfermaria de Olhos, Ouvido e Garganta de Massachusetts/USA MEEI (KAY, 1994) Fonte Figura WORKSHOP ON ACOUSTIC ANALYSIS, TITZE, Ingo R. PH.D. Page 9. 11
  • 12. as part of a cycle to cycle least squared error comparison. A cyclic parameter contour is a time series of any cyclic parameter (e.g., F o cont tude contour, open quotient contour). For periodic signals, the contour is a constant, by For aperiodic signals, the cyclic parameter contour can take on many different shapes, b Materiais e Métodos III signal of its own. Figure 2 shows an Fo contour extracted from a voice signal (top curv contour is highly magnified to show the finest detail in perturbation. The subject (no sustained an [b ] vowel as steady as he could for about 12 seconds at a mid-range value The target Fo was 98 Hz, a G2 on the keyboard. Time is labeled in number of cycles ( instead of seconds because 1 point is plotted for every cycle of vocal fold vibration. N range of frequency variation is 96.7 Hz to 102.4 Hz, about ±3%, but this range is attribute  Análise Acústica  Definição,  Representação da Voz,  Qualidade Vocal,  Descritores Acústicos  Ferramentas  AA: WaveSurfer, Praat; Edição de Áudio: Audacity; Fig  fu fre  Software Estatístico: R, Matlab ©; (Fo us pe  Classificação e Testes: WEKA ©, Java ©; an su Planilhas: Excel ©, LibreOffice. no  ma na ste vo ap ma fo r se Fonte Figura WORKSHOP ON ACOUSTIC ANALYSIS.. Page 9. 12 SUM M ARY
  • 13. Resultados Preliminares I Diagnósticos Confirmados com especialista: 1. Normal 2. Patologias (dez) Campina Grande, 8 de Maio de 2012 13 Sérgio Espinola – LAD/COPIN/CEEI/UFCG
  • 14. Resultados Preliminares II 1. Estudos de Caso (UC) I. UC1: Da Presença de Patologias “Normal X Patológica”: Sucesso esperado (Cerca de 100% de CA)!  A não-normalidade na produção da fala (patologia) está associada ao aparecimento da não-estacionariedade do sinal produzido na fonação sustentada. Efeitos: Mudanças de Amplitude, ruído de turbulência, etc. II. UC2: Dentre Patologias, Identificar qual está presente na fala. Sucesso de cerca de 60% (ainda baixo). Classificador: Redes neurais Artificiais, MLP, Diversas configurações testadas. 2. Protótipo de Aplicação de voz no iPhone/iPad (c): registro e armazenamento da fala. Campina Grande, 8 de Maio de 2012 14
  • 15. Validação: Exemplo  Descritor acústico  Separação de Vozes Normais() / Patológicas() (y=60%) 15 Sérgio Espinola – LAD/COPIN/CEEI/UFCG
  • 16. Validação II: Contraexemplo  Frequência Fundamental Média: Fo  Descritor não útil para a Classificação Pretendida. Uma Linha não separa Normal / Patológica ! Para todas vozes, eixo X, variação de Fo é a mesma (entre 60 Hz e 350 Hz). Normais Patológicas Campina Grande, 8 de Maio de 2012 16 Sérgio Espinola – LAD/COPIN/CEEI/UFCG
  • 17. Considerações Finais  Após a análise e confirmação recente (abril) dos diagnósticos das Patologias por especialista médico, a pesquisa segue em novo ritmo de decobertas e resultados;  O Foco passou para a investigação estatística/inferencial, análise multivariada dos fatores (cerca de 20 descritores acústicos), técnicas de PDSV e de Inteligência Artificial para a separação das classes de patologias pretendidas, etc. Sérgio Espinola – LAD / COPIN / UFCG Campina Grande, 12 de dezembro de 2011 17 sergiodbe@lad.dsc.ufcg.edu.br
  • 18. Validação em Curso: Análise de Componentes Principais (PCA)  Objetivos:  Identificar as principais fontes de variação de dados complexos (muitas variáveis);  Tornar as informações interpretáveis (gráficos simples): Ex. Pareto. Comp. {1-2} podem explicar quase 65% da variabilidade total v 18
  • 19. Trabalhos Futuros  Finalizar o Relatório com Síntese dos Experimentos e Gráficos da PCA anterior;  Cruzar as Análises PCA;  Conhecer “bem” a influência estatística desses descritores acústicos para classificação; Leia-se matematicamente efetivo para as métricas de sucesso.  Revalidar com alguns desses melhores; 19
  • 20. Obrigado! “A voz revela, lá do mais recôndito do ser, nossa condição primeira, nossa autenticidade maior e a sonora expressão da nossa verdade” Edmée Brandi E Mestrando: Sérgio de Brito Espinola Ciência da Computação LAD/COPIN/UFCG Contatos: sergiodbe@lad.dsc.ufcg.edu.br http://twitter.com/sergiodbe 20 LAD/COPIN/CEEI/UFCG Campina Grande, 8 de Maio de 2012

Notas do Editor

  1. 3 momentos! Indicar claramente qual relevância das partes para o todo! Interpretar principais elos!
  2. Explicar bem o TECHNICAL PROBLEM. Ponto de vistas Do natureza do diagnóstico Do processo pelo paciente