SlideShare uma empresa Scribd logo
1 de 19
Descoberta de Conhecimentos em
Textos através da Análise de
Seqüências Temporais
KDD e Mineração de dados
Felipe dos Santos
Informações
• Autores:
• Stanley Loh
• Leonardo Albernaz Amaral
• Leandro KrugWives
• José Palazzo Moreira de Oliveira
O artigo
• Apresenta processo de descoberta de
conhecimento em texto. Utilizando técnica de
análise de seqüências temporais. Foi testado
em prontuários médicos de pacientes
internados em uma clínica psiquiátrica. É uma
ordenação de registros de evoluções de um
paciente registrados por médicos da área. O
benefício consiste na identificação de sintomas
e sinais após remédios terem sido
administrados.
Introdução
• Técnicas de descoberta de conhecimento e
sua importância
• Técnica temporal, pode identificar padrões
estatísticos com tempo associado
• Probabilidade condicional
Trabalhos analisados
• Muitas análises de Mineração de dados
• Padrão seqüencial (Wong, 2000)
• Web Mining (Spiliopoulou; Srikant, 2000)
• Coleções de Textos (Roy, Gevry and
Potternger,2002)
O método utilizado
• Análise de seqüências temporais discretas
• Encontrar conceitos nos conteúdos do texto
• A proposta foi a descoberta num nível acima
das palavras
• Não analisando apenas os termos e expressões,
mas seu significado em relação a fenômenos da
realidade.
Identificação de conceito em
texto
• O processo de identificação foi realizado
por pessoas com auxílio de ferramentas em
software.
• Todas as regras de todos os textos são
comparadas.
• É utilizado ontologia
Exemplo
• O conceito de “alcoolismo” poderia ser
definido pelas regras “álcool -nega” e
“hálito etílico”.
• O símbolo “-” indica um termo negativo,
neste caso “nega” aparece para eliminar
frases como:
• “o paciente nega o uso de álcool”.
Técnicas de análise de seqüência
temporal sobre conceitos
• O objetivo é saber se um conceito
condiciona a aparição do outro no futuro.
• Os textos devem seguir uma ordem
cronológica, formando uma seqüência
temporal
• Para determinação das dependências entre
conceitos é utilizada a probabilidade
condicional
• A técnica foi implementada analisando
textos contíguos (do anterior para o
próximo).
• Os textos dos pacientes, são publicados em
períodos de tempo regulares, bastando que
eles forme uma seqüência ou ordem
cronológica.
Técnicas de análise de seqüência
temporal sobre conceitos
Técnicas de análise de seqüência
temporal sobre conceitos
Avaliação da abordagem sobre
prontuários
• Abordagem foi em cima de prontuários
médicos de pacientes de uma clínica
psiquiátrica
• Cada texto do prontuário estava associado a
diagnósticos que representam doença mental
do paciente
• A classificação usada para o diagnóstico segue
as regras da CID (Classificação Internacional
de Doenças)
• Ao todo foi utilizado uma ontologia de 97
conceitos
• 65 eram referentes a características do
pacientes, como:“agressividade”,
“insônia”,“mora sozinho”,“tabagista”
• 32 foram referentes a remédios
Avaliação da abordagem sobre
prontuários
Conhecimentos
descobertos
• 2/3 dos pacientes que tomam remédio X
têm seu pensamento afetado num futuro
breve, podendo levar a pensamentos
mágicos ou de perseguição
• Pacientes com diagnósticos com
transtornos afetivos, pôde se notar os
seguintes padrões:
• A) remédio Z - fala_doente (conf=28,57%)
• B) remédio Z - nervosismo (conf=28,57%)
• C) remédio Z - melhora (conf=28,57%)
• D) remédio W - remédio K (conf=25%
Conhecimentos
descobertos
Conclusões
• Os médicos concordaram com o conhecimento
encontrados no experimento
• Porém, as descobertas encontradas podem ser
consideradas hipóteses e merecem estudos
aprofundados
• O importante do artigo foi a demonstração da
viabilidade da estratégia para descoberta do
conhecimento
Conclusão
• É possível utilizar de várias maneias a
extração do conhecimento
• Seria interessante se fosse possível
visualizar as informações
Perguntas?
Obrigado

Mais conteúdo relacionado

Semelhante a Descoberta de conhecimento em textos médicos

Semelhante a Descoberta de conhecimento em textos médicos (13)

Tecnicas de Pesquisa em Psicologia 2
Tecnicas de Pesquisa em Psicologia 2Tecnicas de Pesquisa em Psicologia 2
Tecnicas de Pesquisa em Psicologia 2
 
Willian costa rodrigues metodologia cientifica
Willian costa rodrigues metodologia cientificaWillian costa rodrigues metodologia cientifica
Willian costa rodrigues metodologia cientifica
 
Apostila de metodologia cient+¡fica
Apostila de metodologia cient+¡ficaApostila de metodologia cient+¡fica
Apostila de metodologia cient+¡fica
 
Tecnicas de Pesquisa em Psicologia 4
Tecnicas de Pesquisa em Psicologia 4Tecnicas de Pesquisa em Psicologia 4
Tecnicas de Pesquisa em Psicologia 4
 
Conceitualização.pptx
Conceitualização.pptxConceitualização.pptx
Conceitualização.pptx
 
metodologia do trabalho científico 3
metodologia do trabalho científico 3metodologia do trabalho científico 3
metodologia do trabalho científico 3
 
Metodologia cientifica
Metodologia cientificaMetodologia cientifica
Metodologia cientifica
 
Metodologia cientifica
Metodologia cientificaMetodologia cientifica
Metodologia cientifica
 
Metodos e técnica de pesquisa
Metodos e técnica de pesquisaMetodos e técnica de pesquisa
Metodos e técnica de pesquisa
 
Introdução à Psicologia Experimental
Introdução à Psicologia ExperimentalIntrodução à Psicologia Experimental
Introdução à Psicologia Experimental
 
Devani
DevaniDevani
Devani
 
Willian costa rodrigues metodologia cientifica
Willian costa rodrigues metodologia cientificaWillian costa rodrigues metodologia cientifica
Willian costa rodrigues metodologia cientifica
 
Tcos a02
Tcos a02Tcos a02
Tcos a02
 

Descoberta de conhecimento em textos médicos

  • 1. Descoberta de Conhecimentos em Textos através da Análise de Seqüências Temporais KDD e Mineração de dados Felipe dos Santos
  • 2. Informações • Autores: • Stanley Loh • Leonardo Albernaz Amaral • Leandro KrugWives • José Palazzo Moreira de Oliveira
  • 3. O artigo • Apresenta processo de descoberta de conhecimento em texto. Utilizando técnica de análise de seqüências temporais. Foi testado em prontuários médicos de pacientes internados em uma clínica psiquiátrica. É uma ordenação de registros de evoluções de um paciente registrados por médicos da área. O benefício consiste na identificação de sintomas e sinais após remédios terem sido administrados.
  • 4. Introdução • Técnicas de descoberta de conhecimento e sua importância • Técnica temporal, pode identificar padrões estatísticos com tempo associado • Probabilidade condicional
  • 5. Trabalhos analisados • Muitas análises de Mineração de dados • Padrão seqüencial (Wong, 2000) • Web Mining (Spiliopoulou; Srikant, 2000) • Coleções de Textos (Roy, Gevry and Potternger,2002)
  • 6. O método utilizado • Análise de seqüências temporais discretas • Encontrar conceitos nos conteúdos do texto • A proposta foi a descoberta num nível acima das palavras • Não analisando apenas os termos e expressões, mas seu significado em relação a fenômenos da realidade.
  • 7. Identificação de conceito em texto • O processo de identificação foi realizado por pessoas com auxílio de ferramentas em software. • Todas as regras de todos os textos são comparadas. • É utilizado ontologia
  • 8. Exemplo • O conceito de “alcoolismo” poderia ser definido pelas regras “álcool -nega” e “hálito etílico”. • O símbolo “-” indica um termo negativo, neste caso “nega” aparece para eliminar frases como: • “o paciente nega o uso de álcool”.
  • 9. Técnicas de análise de seqüência temporal sobre conceitos • O objetivo é saber se um conceito condiciona a aparição do outro no futuro. • Os textos devem seguir uma ordem cronológica, formando uma seqüência temporal • Para determinação das dependências entre conceitos é utilizada a probabilidade condicional
  • 10. • A técnica foi implementada analisando textos contíguos (do anterior para o próximo). • Os textos dos pacientes, são publicados em períodos de tempo regulares, bastando que eles forme uma seqüência ou ordem cronológica. Técnicas de análise de seqüência temporal sobre conceitos
  • 11. Técnicas de análise de seqüência temporal sobre conceitos
  • 12. Avaliação da abordagem sobre prontuários • Abordagem foi em cima de prontuários médicos de pacientes de uma clínica psiquiátrica • Cada texto do prontuário estava associado a diagnósticos que representam doença mental do paciente • A classificação usada para o diagnóstico segue as regras da CID (Classificação Internacional de Doenças)
  • 13. • Ao todo foi utilizado uma ontologia de 97 conceitos • 65 eram referentes a características do pacientes, como:“agressividade”, “insônia”,“mora sozinho”,“tabagista” • 32 foram referentes a remédios Avaliação da abordagem sobre prontuários
  • 14. Conhecimentos descobertos • 2/3 dos pacientes que tomam remédio X têm seu pensamento afetado num futuro breve, podendo levar a pensamentos mágicos ou de perseguição • Pacientes com diagnósticos com transtornos afetivos, pôde se notar os seguintes padrões:
  • 15. • A) remédio Z - fala_doente (conf=28,57%) • B) remédio Z - nervosismo (conf=28,57%) • C) remédio Z - melhora (conf=28,57%) • D) remédio W - remédio K (conf=25% Conhecimentos descobertos
  • 16. Conclusões • Os médicos concordaram com o conhecimento encontrados no experimento • Porém, as descobertas encontradas podem ser consideradas hipóteses e merecem estudos aprofundados • O importante do artigo foi a demonstração da viabilidade da estratégia para descoberta do conhecimento
  • 17. Conclusão • É possível utilizar de várias maneias a extração do conhecimento • Seria interessante se fosse possível visualizar as informações