Aplicação de redes neurais artificiais na modelagem de um classificador de formas clínicas de dengue utilizando dados genô...
Roteiro <ul><li>Motivação </li></ul><ul><li>Objetivos </li></ul><ul><li>Conceitos Fundamentais </li></ul><ul><li>Metodolog...
Motivação Aplicação de redes neurais artificiais na modelagem de um classificador de formas clínicas de dengue utilizando ...
Dengue Aplicação de redes neurais artificiais na modelagem de um classificador de formas clínicas de dengue utilizando dad...
Dengue: Gravidade <ul><li>Infecção viral - 4 sorotipos </li></ul><ul><li>Ciclos de epidemias </li></ul><ul><li>Demora no d...
Formas clínicas <ul><li>DC  DCC  FHD (DG) </li></ul><ul><li>Aspectos clínicos  e alguns exames </li></ul><ul><ul><li>Impre...
Objetivos <ul><li>Desenvolver um método de predição/classificação das formas clínicas da dengue com ferramentas de computa...
Estado da Arte <ul><li>Lee, V.J., et al., Predictive value of simple clinical and laboratory variables for dengue hemorrha...
Estado da Arte <ul><li>Gomes, A., et al., Classification of dengue fever patients based on gene expression data using  sup...
Conceitos Fundamentais <ul><li>DNA </li></ul><ul><li>Polimorfismos </li></ul><ul><li>Metodologia </li></ul><ul><li>Redes N...
DNA <ul><li>Informação genética </li></ul><ul><li>Dupla fita </li></ul><ul><ul><li>Sequência de nucleotídeos </li></ul></u...
Polimorfismos <ul><li>SNPs - Polimorfismos simples de nucleotídeos </li></ul><ul><ul><li>Altera a sequência genômica </li>...
Metodologia <ul><li>Dados </li></ul><ul><ul><li>105 pacientes dengue </li></ul></ul><ul><ul><li>99 pacientes controle </li...
Tratamento dos dados <ul><li>204 pacientes x 322 loci = 65688 </li></ul><ul><li>Pré-processamento </li></ul><ul><li>Organi...
Problema de Classificação Aplicação de redes neurais artificiais na modelagem de um classificador de formas clínicas de de...
Aplicação de redes neurais artificiais na modelagem de um classificador de formas clínicas de dengue utilizando dados genô...
Resultados Prelimininares <ul><li>Resultados univariados </li></ul><ul><li>Ranking de Odds ratio >=3 </li></ul><ul><li>Eq....
Aplicações de Redes Neurais Artificiais <ul><li>Bioinformática </li></ul><ul><ul><li>Análise das sequências de genoma e de...
Redes Neurais Artificiais <ul><li>Ferramenta de classificação supervisionada </li></ul><ul><li>Baseada no funcionamento do...
Redes Neurais Artificiais Saída Y é 1 se pelo menos dois da entrada for igual a 1 Aplicação de redes neurais artificiais n...
Redes Neurais Artificiais Redes Neurais Artificiais Aplicação de redes neurais artificiais na modelagem de um classificado...
Metodologia II <ul><li>Exportação dos dados do banco </li></ul><ul><li>Transformação em unários </li></ul><ul><li>Normaliz...
Parametrização dos dados Aplicação de redes neurais artificiais na modelagem de um classificador de formas clínicas de den...
Aplicação de redes neurais artificiais na modelagem de um classificador de formas clínicas de dengue utilizando dados genô...
Implementação dos algoritmos <ul><li>Utilizando do código fonte do  Weka  ( Open source ) </li></ul><ul><li>Desenvolvido e...
Configuração da RNA <ul><li>Multilayer perceptron </li></ul><ul><ul><li>Apenas 1 camada escondida </li></ul></ul><ul><ul><...
Agrupamento dos dados <ul><li>Dataset  1 - 7  </li></ul><ul><ul><li>Sem os possíveis não letais recessivos e com fisher <=...
Resultado das Execuções <ul><li>Dataset  11 obteve melhores resultados </li></ul><ul><li>Execução de testes (50 vezes) var...
Aplicação de redes neurais artificiais na modelagem de um classificador de formas clínicas de dengue utilizando dados genô...
61 neurônios de entrada 31 neurônios na camada escondida 2 neurônios na camada de saída
Parâmetros da RNA <ul><li>600 ciclos de treinamento máximo </li></ul><ul><li>400 ciclos para os 25% dos dados utilizados n...
Resultados <ul><li>Após 50 execuções (variando a semente de randomização dos dados) </li></ul><ul><ul><li>75,83% de instân...
Resultado Aplicação de redes neurais artificiais na modelagem de um classificador de formas clínicas de dengue utilizando ...
Discussão Dados clínicos Sensibilidade - 97% Especificidade - 60% Sensibilidade - 100% Especificidade - 46% Aplicação de r...
Conclusões <ul><li>O SGBD facilita a análise de dados genômicos  </li></ul><ul><li>O modelo de predição/classificação univ...
Perspectivas <ul><li>Utilização do modelo para desenvolvimento de assinaturas genéticas multivariadas como um diagnóstico/...
Trabalhos futuros <ul><li>Utilização de métodos de seleção de atributos </li></ul><ul><li>Utilização de  Particle Swarm Op...
Obrigado! Aplicação de redes neurais artificiais na modelagem de um classificador de formas clínicas de dengue utilizando ...
Referências bibliográficas Aplicação de redes neurais artificiais na modelagem de um classificador de formas clínicas de d...
 
Hipóteses Aplicação de redes neurais artificiais na modelagem de um classificador de formas clínicas de dengue utilizando ...
Odds Ratio <ul><li>Razão das chances: </li></ul><ul><ul><li>É a probabilidade de um evento ocorra em um grupo relativo a c...
Equilíbrio de Hardy Weinberg <ul><li>Base da genética de populações </li></ul>Aplicação de redes neurais artificiais na mo...
Teste do Qui-quadrado <ul><li>Teste estatístico </li></ul><ul><li>Medida em que os valores observados desviam do valor esp...
Teste exato de Fisher <ul><li>Teste de significancia estatística em análise de tabelas de contingência quando as amostras ...
Aplicação de redes neurais artificiais na modelagem de um classificador de formas clínicas de dengue utilizando dados genô...
Aplicação de redes neurais artificiais na modelagem de um classificador de formas clínicas de dengue utilizando dados genô...
CC CT TT Fig. Representação gráfica dos genótipos para o promotor do  CFH  (SNP C-257T)  por sequenciamento automático Apl...
Multilayer Perceptron - MLP Aplicação de redes neurais artificiais na modelagem de um classificador de formas clínicas de ...
 
Próximos SlideShares
Carregando em…5
×

TCC Bioinfomática - Genômica da Dengue

2.071 visualizações

Publicada em

Aplicação de Redes Neurais Artificiais na modelagem de um classificador de formas clínicas da dengue utilizando uma abordagem genética.

Publicada em: Tecnologia
0 comentários
0 gostaram
Estatísticas
Notas
  • Seja o primeiro a comentar

  • Seja a primeira pessoa a gostar disto

Sem downloads
Visualizações
Visualizações totais
2.071
No SlideShare
0
A partir de incorporações
0
Número de incorporações
38
Ações
Compartilhamentos
0
Downloads
0
Comentários
0
Gostaram
0
Incorporações 0
Nenhuma incorporação

Nenhuma nota no slide

TCC Bioinfomática - Genômica da Dengue

  1. 1. Aplicação de redes neurais artificiais na modelagem de um classificador de formas clínicas de dengue utilizando dados genômicos Thiego de Oliveira Orientador: Prof. Dr. Fernando Buarque Co-Orientador: Pesq. Dr. Bartolomeu Acioli
  2. 2. Roteiro <ul><li>Motivação </li></ul><ul><li>Objetivos </li></ul><ul><li>Conceitos Fundamentais </li></ul><ul><li>Metodologia </li></ul><ul><li>Contribuições </li></ul><ul><li>Conclusões </li></ul>Aplicação de redes neurais artificiais na modelagem de um classificador de formas clínicas de dengue utilizando dados genômicos - Thiego de Oliveira
  3. 3. Motivação Aplicação de redes neurais artificiais na modelagem de um classificador de formas clínicas de dengue utilizando dados genômicos - Thiego de Oliveira
  4. 4. Dengue Aplicação de redes neurais artificiais na modelagem de um classificador de formas clínicas de dengue utilizando dados genômicos - Thiego de Oliveira
  5. 5. Dengue: Gravidade <ul><li>Infecção viral - 4 sorotipos </li></ul><ul><li>Ciclos de epidemias </li></ul><ul><li>Demora no diagnóstico </li></ul><ul><li>Óbitos em casos graves </li></ul>Aplicação de redes neurais artificiais na modelagem de um classificador de formas clínicas de dengue utilizando dados genômicos - Thiego de Oliveira
  6. 6. Formas clínicas <ul><li>DC DCC FHD (DG) </li></ul><ul><li>Aspectos clínicos e alguns exames </li></ul><ul><ul><li>Impreciso devido a similaridade com outras doenças </li></ul></ul><ul><li>Não há um método de predição/classificação de formas clínicas sem ser por aspectos clínicos </li></ul>Aplicação de redes neurais artificiais na modelagem de um classificador de formas clínicas de dengue utilizando dados genômicos - Thiego de Oliveira
  7. 7. Objetivos <ul><li>Desenvolver um método de predição/classificação das formas clínicas da dengue com ferramentas de computação inteligente </li></ul><ul><ul><li>Tratando com dados genômicos </li></ul></ul>Aplicação de redes neurais artificiais na modelagem de um classificador de formas clínicas de dengue utilizando dados genômicos - Thiego de Oliveira
  8. 8. Estado da Arte <ul><li>Lee, V.J., et al., Predictive value of simple clinical and laboratory variables for dengue hemorrhagic fever in adults - J. Clin. Virol, 2008 - Vizinho mais próximo </li></ul><ul><li>Lee, V.J., et al., Decision tree algorithm in deciding hospitalization for adult patients with dengue haemorrhagic fever in Singapore - Trop. Med. Int. Health, 2009 - Árvore de decisão </li></ul>Aplicação de redes neurais artificiais na modelagem de um classificador de formas clínicas de dengue utilizando dados genômicos - Thiego de Oliveira
  9. 9. Estado da Arte <ul><li>Gomes, A., et al., Classification of dengue fever patients based on gene expression data using support vector machines . 2009 - SVM </li></ul><ul><li>Braga-Neto, U., et al., Classificadores baseados em critério de informação Akaike , utilizando dados genômicos - 2009 </li></ul>Aplicação de redes neurais artificiais na modelagem de um classificador de formas clínicas de dengue utilizando dados genômicos - Thiego de Oliveira
  10. 10. Conceitos Fundamentais <ul><li>DNA </li></ul><ul><li>Polimorfismos </li></ul><ul><li>Metodologia </li></ul><ul><li>Redes Neurais Artificiais </li></ul>Aplicação de redes neurais artificiais na modelagem de um classificador de formas clínicas de dengue utilizando dados genômicos - Thiego de Oliveira
  11. 11. DNA <ul><li>Informação genética </li></ul><ul><li>Dupla fita </li></ul><ul><ul><li>Sequência de nucleotídeos </li></ul></ul><ul><ul><li>46 cromossomos </li></ul></ul>Aplicação de redes neurais artificiais na modelagem de um classificador de formas clínicas de dengue utilizando dados genômicos - Thiego de Oliveira
  12. 12. Polimorfismos <ul><li>SNPs - Polimorfismos simples de nucleotídeos </li></ul><ul><ul><li>Altera a sequência genômica </li></ul></ul><ul><ul><li>Modificações funcionais </li></ul></ul><ul><ul><ul><li>molecular, proteína, ou clínica </li></ul></ul></ul><ul><li>Compreensão das respostas do homem ao vírus </li></ul><ul><li>Marcadores moleculares para outras doenças </li></ul><ul><ul><li>Em dengue: MBL2, Fator H </li></ul></ul>Aplicação de redes neurais artificiais na modelagem de um classificador de formas clínicas de dengue utilizando dados genômicos - Thiego de Oliveira
  13. 13. Metodologia <ul><li>Dados </li></ul><ul><ul><li>105 pacientes dengue </li></ul></ul><ul><ul><li>99 pacientes controle </li></ul></ul><ul><li>322 Loci </li></ul><ul><ul><li>Genes de resposta imune a doenças virais e infecciosas </li></ul></ul><ul><ul><li>Genotipagem em massa: Illumina em colaboração University of Washington </li></ul></ul>Aplicação de redes neurais artificiais na modelagem de um classificador de formas clínicas de dengue utilizando dados genômicos - Thiego de Oliveira
  14. 14. Tratamento dos dados <ul><li>204 pacientes x 322 loci = 65688 </li></ul><ul><li>Pré-processamento </li></ul><ul><li>Organização do banco de dados em tabelas relacionais utilizando o Filemaker Pro </li></ul><ul><li>Criação de sistema de manipulação dos dados baseado em hipóteses </li></ul><ul><li>Criação de cálculos de Odds-ratio, Teste de Fisher, Eq. de Hardy Weinberg, Teste do Qui-quadrado </li></ul>Aplicação de redes neurais artificiais na modelagem de um classificador de formas clínicas de dengue utilizando dados genômicos - Thiego de Oliveira
  15. 15. Problema de Classificação Aplicação de redes neurais artificiais na modelagem de um classificador de formas clínicas de dengue utilizando dados genômicos - Thiego de Oliveira
  16. 16. Aplicação de redes neurais artificiais na modelagem de um classificador de formas clínicas de dengue utilizando dados genômicos - Thiego de Oliveira
  17. 17. Resultados Prelimininares <ul><li>Resultados univariados </li></ul><ul><li>Ranking de Odds ratio >=3 </li></ul><ul><li>Eq. H-W <=0,05 </li></ul><ul><li>Teste de Fisher <=0,01 </li></ul>Aplicação de redes neurais artificiais na modelagem de um classificador de formas clínicas de dengue utilizando dados genômicos - Thiego de Oliveira
  18. 18. Aplicações de Redes Neurais Artificiais <ul><li>Bioinformática </li></ul><ul><ul><li>Análise das sequências de genoma e de proteínas, estudos de padrões de expressão, filogenia, etc. </li></ul></ul><ul><li>Largamente utilizado em reconhecimento de padrões e classificação </li></ul>Aplicação de redes neurais artificiais na modelagem de um classificador de formas clínicas de dengue utilizando dados genômicos - Thiego de Oliveira
  19. 19. Redes Neurais Artificiais <ul><li>Ferramenta de classificação supervisionada </li></ul><ul><li>Baseada no funcionamento do cérebro </li></ul><ul><ul><li>Pesos sinápticos </li></ul></ul><ul><li>Multilayer Perceptron (MLP) </li></ul><ul><ul><li>Backpropagation </li></ul></ul>Aplicação de redes neurais artificiais na modelagem de um classificador de formas clínicas de dengue utilizando dados genômicos - Thiego de Oliveira
  20. 20. Redes Neurais Artificiais Saída Y é 1 se pelo menos dois da entrada for igual a 1 Aplicação de redes neurais artificiais na modelagem de um classificador de formas clínicas de dengue utilizando dados genômicos - Thiego de Oliveira
  21. 21. Redes Neurais Artificiais Redes Neurais Artificiais Aplicação de redes neurais artificiais na modelagem de um classificador de formas clínicas de dengue utilizando dados genômicos - Thiego de Oliveira
  22. 22. Metodologia II <ul><li>Exportação dos dados do banco </li></ul><ul><li>Transformação em unários </li></ul><ul><li>Normalização </li></ul><ul><li>Implementação dos algoritmos </li></ul><ul><li>Treinamento e testes </li></ul><ul><li>Análise de resultados </li></ul>Aplicação de redes neurais artificiais na modelagem de um classificador de formas clínicas de dengue utilizando dados genômicos - Thiego de Oliveira
  23. 23. Parametrização dos dados Aplicação de redes neurais artificiais na modelagem de um classificador de formas clínicas de dengue utilizando dados genômicos - Thiego de Oliveira Genotípicos XX XY YY NR XX (XY+YY) NR (XX+XY) YY NR NR - 0001 YY - 0010 XY - 0100 XX - 1000 NR - 001 XY+YY - 010 XX - 100 NR - 001 YY - 010 XX+XY - 100
  24. 24. Aplicação de redes neurais artificiais na modelagem de um classificador de formas clínicas de dengue utilizando dados genômicos - Thiego de Oliveira
  25. 25. Implementação dos algoritmos <ul><li>Utilizando do código fonte do Weka ( Open source ) </li></ul><ul><li>Desenvolvido em Java (Eclipse) </li></ul><ul><ul><li>Método de treinamento </li></ul></ul><ul><ul><li>Método de teste </li></ul></ul><ul><ul><li>Retorno das estatísticas </li></ul></ul>Aplicação de redes neurais artificiais na modelagem de um classificador de formas clínicas de dengue utilizando dados genômicos - Thiego de Oliveira
  26. 26. Configuração da RNA <ul><li>Multilayer perceptron </li></ul><ul><ul><li>Apenas 1 camada escondida </li></ul></ul><ul><ul><li>Neurônios da camada escondida = (neurônios de entrada + neurônios de saída) / 2 </li></ul></ul><ul><ul><li>Camada de entrada </li></ul></ul><ul><ul><ul><li>Dados genotípicos </li></ul></ul></ul><ul><ul><ul><li>Idade, sexo, tipo de infecção </li></ul></ul></ul><ul><ul><li>Camada de saída </li></ul></ul><ul><ul><ul><li>Fenótipos </li></ul></ul></ul>Aplicação de redes neurais artificiais na modelagem de um classificador de formas clínicas de dengue utilizando dados genômicos - Thiego de Oliveira
  27. 27. Agrupamento dos dados <ul><li>Dataset 1 - 7 </li></ul><ul><ul><li>Sem os possíveis não letais recessivos e com fisher <=0,05 </li></ul></ul><ul><li>Dataset 8 - 14 </li></ul><ul><ul><li>Odds-Ratio >=2,4 </li></ul></ul><ul><li>Dataset 15 - 21 </li></ul><ul><ul><li>Odds-Ratio >=3 e fisher <=0,01 </li></ul></ul>Aplicação de redes neurais artificiais na modelagem de um classificador de formas clínicas de dengue utilizando dados genômicos - Thiego de Oliveira
  28. 28. Resultado das Execuções <ul><li>Dataset 11 obteve melhores resultados </li></ul><ul><li>Execução de testes (50 vezes) variando as entradas (hipóteses) </li></ul>Aplicação de redes neurais artificiais na modelagem de um classificador de formas clínicas de dengue utilizando dados genômicos - Thiego de Oliveira
  29. 29. Aplicação de redes neurais artificiais na modelagem de um classificador de formas clínicas de dengue utilizando dados genômicos - Thiego de Oliveira
  30. 30. 61 neurônios de entrada 31 neurônios na camada escondida 2 neurônios na camada de saída
  31. 31. Parâmetros da RNA <ul><li>600 ciclos de treinamento máximo </li></ul><ul><li>400 ciclos para os 25% dos dados utilizados na validação </li></ul><ul><li>Taxa de aprendizado: 0,3 </li></ul><ul><li>Momento: 0,2 </li></ul><ul><li>66% dos dados (69 instâncias) para treinamento </li></ul><ul><li>33% dos dados (36 instâncias) para teste </li></ul>Aplicação de redes neurais artificiais na modelagem de um classificador de formas clínicas de dengue utilizando dados genômicos - Thiego de Oliveira
  32. 32. Resultados <ul><li>Após 50 execuções (variando a semente de randomização dos dados) </li></ul><ul><ul><li>75,83% de instâncias corretamente classificadas (média) </li></ul></ul><ul><ul><li>84,47% de sensibilidade média </li></ul></ul><ul><ul><li>57,94% de especificidade média </li></ul></ul>Aplicação de redes neurais artificiais na modelagem de um classificador de formas clínicas de dengue utilizando dados genômicos - Thiego de Oliveira
  33. 33. Resultado Aplicação de redes neurais artificiais na modelagem de um classificador de formas clínicas de dengue utilizando dados genômicos - Thiego de Oliveira
  34. 34. Discussão Dados clínicos Sensibilidade - 97% Especificidade - 60% Sensibilidade - 100% Especificidade - 46% Aplicação de redes neurais artificiais na modelagem de um classificador de formas clínicas de dengue utilizando dados genômicos - Thiego de Oliveira
  35. 35. Conclusões <ul><li>O SGBD facilita a análise de dados genômicos </li></ul><ul><li>O modelo de predição/classificação univariado mostra a possibilidade de estudo mais aprofundado de cada gene </li></ul><ul><li>O modelo utilizando RNA’s para predição de formas clínicas da dengue utiliza de forma original dados genômicos </li></ul>Aplicação de redes neurais artificiais na modelagem de um classificador de formas clínicas de dengue utilizando dados genômicos - Thiego de Oliveira
  36. 36. Perspectivas <ul><li>Utilização do modelo para desenvolvimento de assinaturas genéticas multivariadas como um diagnóstico/prognóstico diferencial das formas clínicas </li></ul><ul><li>Utilização em kits de diagnóstico desenvolvimento de novas estratégias de terapia </li></ul>Aplicação de redes neurais artificiais na modelagem de um classificador de formas clínicas de dengue utilizando dados genômicos - Thiego de Oliveira
  37. 37. Trabalhos futuros <ul><li>Utilização de métodos de seleção de atributos </li></ul><ul><li>Utilização de Particle Swarm Optimization ( PSO ) para manipulação e otimização dos parâmetros da RNA </li></ul><ul><li>Aumento da coorte de pacientes para um estudo mais confiável </li></ul><ul><ul><li>Otimização da classificação dos pacientes </li></ul></ul>Aplicação de redes neurais artificiais na modelagem de um classificador de formas clínicas de dengue utilizando dados genômicos - Thiego de Oliveira
  38. 38. Obrigado! Aplicação de redes neurais artificiais na modelagem de um classificador de formas clínicas de dengue utilizando dados genômicos - Thiego de Oliveira
  39. 39. Referências bibliográficas Aplicação de redes neurais artificiais na modelagem de um classificador de formas clínicas de dengue utilizando dados genômicos - Thiego de Oliveira
  40. 41. Hipóteses Aplicação de redes neurais artificiais na modelagem de um classificador de formas clínicas de dengue utilizando dados genômicos - Thiego de Oliveira
  41. 42. Odds Ratio <ul><li>Razão das chances: </li></ul><ul><ul><li>É a probabilidade de um evento ocorra em um grupo relativo a chance de ocorrem em outro grupo </li></ul></ul>Aplicação de redes neurais artificiais na modelagem de um classificador de formas clínicas de dengue utilizando dados genômicos - Thiego de Oliveira
  42. 43. Equilíbrio de Hardy Weinberg <ul><li>Base da genética de populações </li></ul>Aplicação de redes neurais artificiais na modelagem de um classificador de formas clínicas de dengue utilizando dados genômicos - Thiego de Oliveira
  43. 44. Teste do Qui-quadrado <ul><li>Teste estatístico </li></ul><ul><li>Medida em que os valores observados desviam do valor esperado </li></ul><ul><li>Quanto maior o qui-quadrado, mais significante a relação entre a variável dependente e a variável independente </li></ul>Aplicação de redes neurais artificiais na modelagem de um classificador de formas clínicas de dengue utilizando dados genômicos - Thiego de Oliveira
  44. 45. Teste exato de Fisher <ul><li>Teste de significancia estatística em análise de tabelas de contingência quando as amostras são pequenas </li></ul><ul><li>Validado no R </li></ul>Aplicação de redes neurais artificiais na modelagem de um classificador de formas clínicas de dengue utilizando dados genômicos - Thiego de Oliveira
  45. 46. Aplicação de redes neurais artificiais na modelagem de um classificador de formas clínicas de dengue utilizando dados genômicos - Thiego de Oliveira
  46. 47. Aplicação de redes neurais artificiais na modelagem de um classificador de formas clínicas de dengue utilizando dados genômicos - Thiego de Oliveira
  47. 48. CC CT TT Fig. Representação gráfica dos genótipos para o promotor do CFH (SNP C-257T) por sequenciamento automático Aplicação de redes neurais artificiais na modelagem de um classificador de formas clínicas de dengue utilizando dados genômicos - Thiego de Oliveira
  48. 49. Multilayer Perceptron - MLP Aplicação de redes neurais artificiais na modelagem de um classificador de formas clínicas de dengue utilizando dados genômicos - Thiego de Oliveira

×