SlideShare uma empresa Scribd logo
Programação
Gené.ca
e
Agrupamento
por

U.lidade
para
Análise
de
Dados
Genômicos



      Cassio
Pennachin,
Lucio
Coelho,

      Maurício
Mudado,
Ben
Goertzel

Desafios
Pós‐Genoma

•  Influência
x
causa

•  Iden.ficar
genes
e

   seus
papéis

•  Interações

   complexas
entre

   genes

•  Sequência
x

   expressão
(nível
de

   a.vidade)

Microarrays

      •  Permitem
medir

         simultaneamente
a

         expressão
de
milhares

         de
genes.

      •  Dados
com
bastante

         ruído.

Mineração
de
Dados
Genômicos

•  Obje.vos:
Formulação
de
hipóteses

  –  Sugestão
de
genes
relacionados
a
uma
condição

  –  Inferência
de
relações
intergenes

  –  Inferência
de
função
de
genes


•  Ferramentas:

  –  Agrupamento:
simples,
mas
ignora
muitos

     relacionamentos
entre
genes
e
sofre
com
a
qualidade

     de
dados

  –  Classificação:
técnicas
robustas,
mas
em
geral
acurácia

     é
menos
relevante
que
informação
inteligível

Metodologia
Open
Biomind

1.    Pré‐processar
e
enriquecer
os
dados

2.    Programação
gené.ca

3.    Evoluir
conjuntos
de
modelos
de
classificação

4.    Mineração
de
dados

      1.  Análise
de
u.lidade
de
atributos

      2.  MUTIC:
Agrupamento
de
atributos
com
base
em

          seu
uso
por
modelos


       h"p://code.google.com/p/openbiomind

Pré‐Processamento
dos
Dados

•  Filtragem
de
genes
inúteis

•  Normalização
(0,
1)

•  Incorporação
de
dados
de

   ontologia:
Gene
Ontology

   (GO),
Protein
Informa.on

   Resource
(PIR)

Dataset:
Câncer
de
Próstata

•  Dados
originais:
Tan
and
Gilbert,
2003

   –  hdp://sdmc.lit.org.sg/GEDatasets/Datasets.
html#Prostate

   –  12600
genes;


   –  Treinamento:
102
indivíduos
(52
câncer,
50
controle);

   –  Testes:
34
indivíduos
(25
câncer,
9
controle);

•  Pré‐processamento:

   –  Eliminação
de
genes
com
expressão
uniforme
ou

      muito
baixa
(ruído)

   –  Inclusão
de
categorias
de
Gene
Ontology
e
PIR

   –  4779
atributos
(1705
genes;
2430
GO;
644
PIR)

Classificação
via
Programação
Gené.ca


                   •  “Evolução”
de
uma

                      população
de
modelos.

                   •  Modelos
são
árvores

                      com
expressões
lógicas

                      ou
aritmé.cas.

                   •  Modelos
compactos
e

                      inteligíveis.

                   •  Conjunto
diverso
de

                      modelos
gerados
em

                      paralelo.

Classificação
via
Programação
Gené.ca


Real
vs

               P
    N
    O.mização
da
função
de

Modelo

                                qualidade:


  P
           VP
   FP

  N
           FN
   VN
     Q
=
F1‐measure
–
N/2


F‐measure:

               Penalidade
para
modelos

                           triviais
(saída
constante)
e

                               modelos
complexos.

                            Balanceamento
da
base

                           de
dados
por
sampling
de

                             classe
mais
frequente.

Exemplo:
Modelo
de
Classificação

Conjuntos
de
Modelos

•  Resultado
de
uma
execução
do
algoritmo:

  –  Ensemble
formado
por
100
melhores
modelos

  –  Classificação:
votação
ponderada

•  Workflow
upico:
1000
execuções.


•  Resultados
para
Câncer
de
Próstata:
100%
de

   acurácia
em
treinamento,
97%
em
teste.

•  Mas
acurácia
não
basta!

Mineração
de
Dados

•  Atributos
mais
úteis

•  Atributos
relacionados:
agrupamento
por

   u.lidade
(genes
que
são
úteis

em
conjunto

   para
classificar
o
problema
são
relacionados)


•  Resultado:

  –  Anotação
de
genes
desconhecidos

  –  Sugestão
para
pesquisa
biológica

Perfis
de
U.lidade

•  Cada
atributo
tem
um
vetor
de
u.lidade
U(i)

•  U(i,j)
=
porcentagem
de
modelos
no
j‐ésimo
ensemble
que

   u.lizam
o
atributo
i.

•  Atributos
mais
úteis:
maior
U(i)
médio

             M1
     M2
    M3
   M4
    M5
     M6
    …
 M1000

      g1
      0
   0.11
    0
    0
   0.23
      0
   …
     0.58

      g2
      0
   0.43
    0
    0
      0
      0
   …
        0

     GO1
   0.54
      0
    0
    0
      0
      0
   …
        0

      …
      …
      …
     …
    …
     …
      …
    …
       …

      Fn
   0.41
      0
    0
    0
      0
   0.56
   ...
      0

Agrupamento
Baseado
em

            U.lidade

•  Agrupamento
hierárquico
n‐ário
dos
perfis
de

   u.lidade
por
similaridade.


•  Qualidade:
homogeneidade
x
separação

      Método
          Qualidade
do
1o
 Qualidade
do

                       cluster
         20o
cluster

      Por
u.lidade
    0.623
           0.543

      Por
expressão
   0.369
           0.169


•  70%
dos
genes
dos
5
melhores
clusters
por

   u.lidade
com
relação
conhecida
com
Câncer

   de
Próstata.

Agrupamento
Baseado
em

       U.lidade

Inferindo
Relações
Intergenes


Mais conteúdo relacionado

Semelhante a Mineração de Dados Genômicos com Open Biomind

Stabvida oportunidades profissionais
Stabvida oportunidades profissionaisStabvida oportunidades profissionais
Stabvida oportunidades profissionais
Francisco Couto
 
Laboratório de Biotecnologia - Rna seq
Laboratório de Biotecnologia - Rna seqLaboratório de Biotecnologia - Rna seq
Laboratório de Biotecnologia - Rna seqGabriel Fernandes
 
Aula 2 - encontrando similaridades de sequências
Aula 2  - encontrando similaridades de sequênciasAula 2  - encontrando similaridades de sequências
Aula 2 - encontrando similaridades de sequências
Francisco Prosdocimi
 
Anotação Gênica Funcional
Anotação Gênica FuncionalAnotação Gênica Funcional
Anotação Gênica Funcional
Daniel Guariz Pinheiro
 
Qualificação de Mestrado
Qualificação de MestradoQualificação de Mestrado
Qualificação de Mestrado
Miguel Galves
 
Apresentação expotec
Apresentação expotecApresentação expotec
Apresentação expotec
Jozias Rolim
 
Por que preciso aprender algoritmo genético?
Por que preciso aprender algoritmo genético?Por que preciso aprender algoritmo genético?
Por que preciso aprender algoritmo genético?
Jozias Rolim
 
Palestra Marcos Vinicius Silva - Seminário ANCP 2014
Palestra Marcos Vinicius Silva - Seminário ANCP 2014Palestra Marcos Vinicius Silva - Seminário ANCP 2014
Palestra Marcos Vinicius Silva - Seminário ANCP 2014ANCP Ribeirão Preto
 
Indrodução a Bioinformática
Indrodução a BioinformáticaIndrodução a Bioinformática
Indrodução a Bioinformática
Ricardo Leite
 

Semelhante a Mineração de Dados Genômicos com Open Biomind (10)

Stabvida oportunidades profissionais
Stabvida oportunidades profissionaisStabvida oportunidades profissionais
Stabvida oportunidades profissionais
 
Laboratório de Biotecnologia - Rna seq
Laboratório de Biotecnologia - Rna seqLaboratório de Biotecnologia - Rna seq
Laboratório de Biotecnologia - Rna seq
 
Aula 2 - encontrando similaridades de sequências
Aula 2  - encontrando similaridades de sequênciasAula 2  - encontrando similaridades de sequências
Aula 2 - encontrando similaridades de sequências
 
Anotação Gênica Funcional
Anotação Gênica FuncionalAnotação Gênica Funcional
Anotação Gênica Funcional
 
Minicurso 2013
Minicurso 2013Minicurso 2013
Minicurso 2013
 
Qualificação de Mestrado
Qualificação de MestradoQualificação de Mestrado
Qualificação de Mestrado
 
Apresentação expotec
Apresentação expotecApresentação expotec
Apresentação expotec
 
Por que preciso aprender algoritmo genético?
Por que preciso aprender algoritmo genético?Por que preciso aprender algoritmo genético?
Por que preciso aprender algoritmo genético?
 
Palestra Marcos Vinicius Silva - Seminário ANCP 2014
Palestra Marcos Vinicius Silva - Seminário ANCP 2014Palestra Marcos Vinicius Silva - Seminário ANCP 2014
Palestra Marcos Vinicius Silva - Seminário ANCP 2014
 
Indrodução a Bioinformática
Indrodução a BioinformáticaIndrodução a Bioinformática
Indrodução a Bioinformática
 

Último

UFCD_8298_Cozinha criativa_índice do manual
UFCD_8298_Cozinha criativa_índice do manualUFCD_8298_Cozinha criativa_índice do manual
UFCD_8298_Cozinha criativa_índice do manual
Manuais Formação
 
livro da EJA - 2a ETAPA - 4o e 5o ano. para análise do professorpdf
livro da EJA - 2a ETAPA - 4o e 5o ano. para análise do professorpdflivro da EJA - 2a ETAPA - 4o e 5o ano. para análise do professorpdf
livro da EJA - 2a ETAPA - 4o e 5o ano. para análise do professorpdf
Escola Municipal Jesus Cristo
 
O sentimento nacional brasiliero, segundo o historiador Jose Murlo de Carvalho
O sentimento nacional brasiliero, segundo o historiador Jose Murlo de CarvalhoO sentimento nacional brasiliero, segundo o historiador Jose Murlo de Carvalho
O sentimento nacional brasiliero, segundo o historiador Jose Murlo de Carvalho
analuisasesso
 
Caderno de Formação_PORTUGUÊS ESTRAN.pdf
Caderno de Formação_PORTUGUÊS ESTRAN.pdfCaderno de Formação_PORTUGUÊS ESTRAN.pdf
Caderno de Formação_PORTUGUÊS ESTRAN.pdf
carlaslr1
 
Caderno de Resumos XVIII ENPFil UFU, IX EPGFil UFU E VII EPFEM.pdf
Caderno de Resumos XVIII ENPFil UFU, IX EPGFil UFU E VII EPFEM.pdfCaderno de Resumos XVIII ENPFil UFU, IX EPGFil UFU E VII EPFEM.pdf
Caderno de Resumos XVIII ENPFil UFU, IX EPGFil UFU E VII EPFEM.pdf
enpfilosofiaufu
 
EJA -livro para professor -dos anos iniciais letramento e alfabetização.pdf
EJA -livro para professor -dos anos iniciais letramento e alfabetização.pdfEJA -livro para professor -dos anos iniciais letramento e alfabetização.pdf
EJA -livro para professor -dos anos iniciais letramento e alfabetização.pdf
Escola Municipal Jesus Cristo
 
Fato X Opinião (Língua Portuguesa 9º Ano).pptx
Fato X Opinião (Língua Portuguesa 9º Ano).pptxFato X Opinião (Língua Portuguesa 9º Ano).pptx
Fato X Opinião (Língua Portuguesa 9º Ano).pptx
MariaFatima425285
 
os-lusiadas-resumo-os-lusiadas-10-ano.pdf
os-lusiadas-resumo-os-lusiadas-10-ano.pdfos-lusiadas-resumo-os-lusiadas-10-ano.pdf
os-lusiadas-resumo-os-lusiadas-10-ano.pdf
GiselaAlves15
 
the_story_garden_5_SB_with_activities.pdf
the_story_garden_5_SB_with_activities.pdfthe_story_garden_5_SB_with_activities.pdf
the_story_garden_5_SB_with_activities.pdf
CarinaSoto12
 
CADERNO DE CONCEITOS E ORIENTAÇÕES DO CENSO ESCOLAR 2024.pdf
CADERNO DE CONCEITOS E ORIENTAÇÕES DO CENSO ESCOLAR 2024.pdfCADERNO DE CONCEITOS E ORIENTAÇÕES DO CENSO ESCOLAR 2024.pdf
CADERNO DE CONCEITOS E ORIENTAÇÕES DO CENSO ESCOLAR 2024.pdf
NatySousa3
 
Especialidade - Animais Ameaçados de Extinção(1).pdf
Especialidade - Animais Ameaçados de Extinção(1).pdfEspecialidade - Animais Ameaçados de Extinção(1).pdf
Especialidade - Animais Ameaçados de Extinção(1).pdf
DanielCastro80471
 
Slides Lição 9, Betel, Ordenança para uma vida de santificação, 2Tr24.pptx
Slides Lição 9, Betel, Ordenança para uma vida de santificação, 2Tr24.pptxSlides Lição 9, Betel, Ordenança para uma vida de santificação, 2Tr24.pptx
Slides Lição 9, Betel, Ordenança para uma vida de santificação, 2Tr24.pptx
LuizHenriquedeAlmeid6
 
proposta curricular ou plano de cursode lingua portuguesa eja anos finais ( ...
proposta curricular  ou plano de cursode lingua portuguesa eja anos finais ( ...proposta curricular  ou plano de cursode lingua portuguesa eja anos finais ( ...
proposta curricular ou plano de cursode lingua portuguesa eja anos finais ( ...
Escola Municipal Jesus Cristo
 
Slides Lição 11, CPAD, A Realidade Bíblica do Inferno, 2Tr24.pptx
Slides Lição 11, CPAD, A Realidade Bíblica do Inferno, 2Tr24.pptxSlides Lição 11, CPAD, A Realidade Bíblica do Inferno, 2Tr24.pptx
Slides Lição 11, CPAD, A Realidade Bíblica do Inferno, 2Tr24.pptx
LuizHenriquedeAlmeid6
 
Caça-palavras ortografia M antes de P e B.
Caça-palavras    ortografia M antes de P e B.Caça-palavras    ortografia M antes de P e B.
Caça-palavras ortografia M antes de P e B.
Mary Alvarenga
 
Egito antigo resumo - aula de história.pdf
Egito antigo resumo - aula de história.pdfEgito antigo resumo - aula de história.pdf
Egito antigo resumo - aula de história.pdf
sthefanydesr
 
MÁRTIRES DE UGANDA Convertem-se ao Cristianismo - 1885-1887.pptx
MÁRTIRES DE UGANDA Convertem-se ao Cristianismo - 1885-1887.pptxMÁRTIRES DE UGANDA Convertem-se ao Cristianismo - 1885-1887.pptx
MÁRTIRES DE UGANDA Convertem-se ao Cristianismo - 1885-1887.pptx
Martin M Flynn
 
Aula01 - ensino médio - (Filosofia).pptx
Aula01 - ensino médio - (Filosofia).pptxAula01 - ensino médio - (Filosofia).pptx
Aula01 - ensino médio - (Filosofia).pptx
kdn15710
 
Unificação da Itália e a formação da Alemanha
Unificação da Itália e a formação da AlemanhaUnificação da Itália e a formação da Alemanha
Unificação da Itália e a formação da Alemanha
Acrópole - História & Educação
 
Apresentação_Primeira_Guerra_Mundial 9 ANO-1.pptx
Apresentação_Primeira_Guerra_Mundial 9 ANO-1.pptxApresentação_Primeira_Guerra_Mundial 9 ANO-1.pptx
Apresentação_Primeira_Guerra_Mundial 9 ANO-1.pptx
JulianeMelo17
 

Último (20)

UFCD_8298_Cozinha criativa_índice do manual
UFCD_8298_Cozinha criativa_índice do manualUFCD_8298_Cozinha criativa_índice do manual
UFCD_8298_Cozinha criativa_índice do manual
 
livro da EJA - 2a ETAPA - 4o e 5o ano. para análise do professorpdf
livro da EJA - 2a ETAPA - 4o e 5o ano. para análise do professorpdflivro da EJA - 2a ETAPA - 4o e 5o ano. para análise do professorpdf
livro da EJA - 2a ETAPA - 4o e 5o ano. para análise do professorpdf
 
O sentimento nacional brasiliero, segundo o historiador Jose Murlo de Carvalho
O sentimento nacional brasiliero, segundo o historiador Jose Murlo de CarvalhoO sentimento nacional brasiliero, segundo o historiador Jose Murlo de Carvalho
O sentimento nacional brasiliero, segundo o historiador Jose Murlo de Carvalho
 
Caderno de Formação_PORTUGUÊS ESTRAN.pdf
Caderno de Formação_PORTUGUÊS ESTRAN.pdfCaderno de Formação_PORTUGUÊS ESTRAN.pdf
Caderno de Formação_PORTUGUÊS ESTRAN.pdf
 
Caderno de Resumos XVIII ENPFil UFU, IX EPGFil UFU E VII EPFEM.pdf
Caderno de Resumos XVIII ENPFil UFU, IX EPGFil UFU E VII EPFEM.pdfCaderno de Resumos XVIII ENPFil UFU, IX EPGFil UFU E VII EPFEM.pdf
Caderno de Resumos XVIII ENPFil UFU, IX EPGFil UFU E VII EPFEM.pdf
 
EJA -livro para professor -dos anos iniciais letramento e alfabetização.pdf
EJA -livro para professor -dos anos iniciais letramento e alfabetização.pdfEJA -livro para professor -dos anos iniciais letramento e alfabetização.pdf
EJA -livro para professor -dos anos iniciais letramento e alfabetização.pdf
 
Fato X Opinião (Língua Portuguesa 9º Ano).pptx
Fato X Opinião (Língua Portuguesa 9º Ano).pptxFato X Opinião (Língua Portuguesa 9º Ano).pptx
Fato X Opinião (Língua Portuguesa 9º Ano).pptx
 
os-lusiadas-resumo-os-lusiadas-10-ano.pdf
os-lusiadas-resumo-os-lusiadas-10-ano.pdfos-lusiadas-resumo-os-lusiadas-10-ano.pdf
os-lusiadas-resumo-os-lusiadas-10-ano.pdf
 
the_story_garden_5_SB_with_activities.pdf
the_story_garden_5_SB_with_activities.pdfthe_story_garden_5_SB_with_activities.pdf
the_story_garden_5_SB_with_activities.pdf
 
CADERNO DE CONCEITOS E ORIENTAÇÕES DO CENSO ESCOLAR 2024.pdf
CADERNO DE CONCEITOS E ORIENTAÇÕES DO CENSO ESCOLAR 2024.pdfCADERNO DE CONCEITOS E ORIENTAÇÕES DO CENSO ESCOLAR 2024.pdf
CADERNO DE CONCEITOS E ORIENTAÇÕES DO CENSO ESCOLAR 2024.pdf
 
Especialidade - Animais Ameaçados de Extinção(1).pdf
Especialidade - Animais Ameaçados de Extinção(1).pdfEspecialidade - Animais Ameaçados de Extinção(1).pdf
Especialidade - Animais Ameaçados de Extinção(1).pdf
 
Slides Lição 9, Betel, Ordenança para uma vida de santificação, 2Tr24.pptx
Slides Lição 9, Betel, Ordenança para uma vida de santificação, 2Tr24.pptxSlides Lição 9, Betel, Ordenança para uma vida de santificação, 2Tr24.pptx
Slides Lição 9, Betel, Ordenança para uma vida de santificação, 2Tr24.pptx
 
proposta curricular ou plano de cursode lingua portuguesa eja anos finais ( ...
proposta curricular  ou plano de cursode lingua portuguesa eja anos finais ( ...proposta curricular  ou plano de cursode lingua portuguesa eja anos finais ( ...
proposta curricular ou plano de cursode lingua portuguesa eja anos finais ( ...
 
Slides Lição 11, CPAD, A Realidade Bíblica do Inferno, 2Tr24.pptx
Slides Lição 11, CPAD, A Realidade Bíblica do Inferno, 2Tr24.pptxSlides Lição 11, CPAD, A Realidade Bíblica do Inferno, 2Tr24.pptx
Slides Lição 11, CPAD, A Realidade Bíblica do Inferno, 2Tr24.pptx
 
Caça-palavras ortografia M antes de P e B.
Caça-palavras    ortografia M antes de P e B.Caça-palavras    ortografia M antes de P e B.
Caça-palavras ortografia M antes de P e B.
 
Egito antigo resumo - aula de história.pdf
Egito antigo resumo - aula de história.pdfEgito antigo resumo - aula de história.pdf
Egito antigo resumo - aula de história.pdf
 
MÁRTIRES DE UGANDA Convertem-se ao Cristianismo - 1885-1887.pptx
MÁRTIRES DE UGANDA Convertem-se ao Cristianismo - 1885-1887.pptxMÁRTIRES DE UGANDA Convertem-se ao Cristianismo - 1885-1887.pptx
MÁRTIRES DE UGANDA Convertem-se ao Cristianismo - 1885-1887.pptx
 
Aula01 - ensino médio - (Filosofia).pptx
Aula01 - ensino médio - (Filosofia).pptxAula01 - ensino médio - (Filosofia).pptx
Aula01 - ensino médio - (Filosofia).pptx
 
Unificação da Itália e a formação da Alemanha
Unificação da Itália e a formação da AlemanhaUnificação da Itália e a formação da Alemanha
Unificação da Itália e a formação da Alemanha
 
Apresentação_Primeira_Guerra_Mundial 9 ANO-1.pptx
Apresentação_Primeira_Guerra_Mundial 9 ANO-1.pptxApresentação_Primeira_Guerra_Mundial 9 ANO-1.pptx
Apresentação_Primeira_Guerra_Mundial 9 ANO-1.pptx
 

Mineração de Dados Genômicos com Open Biomind