SlideShare uma empresa Scribd logo
1 de 16
Programação
Gené.ca
e
Agrupamento
por

U.lidade
para
Análise
de
Dados
Genômicos



      Cassio
Pennachin,
Lucio
Coelho,

      Maurício
Mudado,
Ben
Goertzel

Desafios
Pós‐Genoma

•  Influência
x
causa

•  Iden.ficar
genes
e

   seus
papéis

•  Interações

   complexas
entre

   genes

•  Sequência
x

   expressão
(nível
de

   a.vidade)

Microarrays

      •  Permitem
medir

         simultaneamente
a

         expressão
de
milhares

         de
genes.

      •  Dados
com
bastante

         ruído.

Mineração
de
Dados
Genômicos

•  Obje.vos:
Formulação
de
hipóteses

  –  Sugestão
de
genes
relacionados
a
uma
condição

  –  Inferência
de
relações
intergenes

  –  Inferência
de
função
de
genes


•  Ferramentas:

  –  Agrupamento:
simples,
mas
ignora
muitos

     relacionamentos
entre
genes
e
sofre
com
a
qualidade

     de
dados

  –  Classificação:
técnicas
robustas,
mas
em
geral
acurácia

     é
menos
relevante
que
informação
inteligível

Metodologia
Open
Biomind

1.    Pré‐processar
e
enriquecer
os
dados

2.    Programação
gené.ca

3.    Evoluir
conjuntos
de
modelos
de
classificação

4.    Mineração
de
dados

      1.  Análise
de
u.lidade
de
atributos

      2.  MUTIC:
Agrupamento
de
atributos
com
base
em

          seu
uso
por
modelos


       h"p://code.google.com/p/openbiomind

Pré‐Processamento
dos
Dados

•  Filtragem
de
genes
inúteis

•  Normalização
(0,
1)

•  Incorporação
de
dados
de

   ontologia:
Gene
Ontology

   (GO),
Protein
Informa.on

   Resource
(PIR)

Dataset:
Câncer
de
Próstata

•  Dados
originais:
Tan
and
Gilbert,
2003

   –  hdp://sdmc.lit.org.sg/GEDatasets/Datasets.
html#Prostate

   –  12600
genes;


   –  Treinamento:
102
indivíduos
(52
câncer,
50
controle);

   –  Testes:
34
indivíduos
(25
câncer,
9
controle);

•  Pré‐processamento:

   –  Eliminação
de
genes
com
expressão
uniforme
ou

      muito
baixa
(ruído)

   –  Inclusão
de
categorias
de
Gene
Ontology
e
PIR

   –  4779
atributos
(1705
genes;
2430
GO;
644
PIR)

Classificação
via
Programação
Gené.ca


                   •  “Evolução”
de
uma

                      população
de
modelos.

                   •  Modelos
são
árvores

                      com
expressões
lógicas

                      ou
aritmé.cas.

                   •  Modelos
compactos
e

                      inteligíveis.

                   •  Conjunto
diverso
de

                      modelos
gerados
em

                      paralelo.

Classificação
via
Programação
Gené.ca


Real
vs

               P
    N
    O.mização
da
função
de

Modelo

                                qualidade:


  P
           VP
   FP

  N
           FN
   VN
     Q
=
F1‐measure
–
N/2


F‐measure:

               Penalidade
para
modelos

                           triviais
(saída
constante)
e

                               modelos
complexos.

                            Balanceamento
da
base

                           de
dados
por
sampling
de

                             classe
mais
frequente.

Exemplo:
Modelo
de
Classificação

Conjuntos
de
Modelos

•  Resultado
de
uma
execução
do
algoritmo:

  –  Ensemble
formado
por
100
melhores
modelos

  –  Classificação:
votação
ponderada

•  Workflow
upico:
1000
execuções.


•  Resultados
para
Câncer
de
Próstata:
100%
de

   acurácia
em
treinamento,
97%
em
teste.

•  Mas
acurácia
não
basta!

Mineração
de
Dados

•  Atributos
mais
úteis

•  Atributos
relacionados:
agrupamento
por

   u.lidade
(genes
que
são
úteis

em
conjunto

   para
classificar
o
problema
são
relacionados)


•  Resultado:

  –  Anotação
de
genes
desconhecidos

  –  Sugestão
para
pesquisa
biológica

Perfis
de
U.lidade

•  Cada
atributo
tem
um
vetor
de
u.lidade
U(i)

•  U(i,j)
=
porcentagem
de
modelos
no
j‐ésimo
ensemble
que

   u.lizam
o
atributo
i.

•  Atributos
mais
úteis:
maior
U(i)
médio

             M1
     M2
    M3
   M4
    M5
     M6
    …
 M1000

      g1
      0
   0.11
    0
    0
   0.23
      0
   …
     0.58

      g2
      0
   0.43
    0
    0
      0
      0
   …
        0

     GO1
   0.54
      0
    0
    0
      0
      0
   …
        0

      …
      …
      …
     …
    …
     …
      …
    …
       …

      Fn
   0.41
      0
    0
    0
      0
   0.56
   ...
      0

Agrupamento
Baseado
em

            U.lidade

•  Agrupamento
hierárquico
n‐ário
dos
perfis
de

   u.lidade
por
similaridade.


•  Qualidade:
homogeneidade
x
separação

      Método
          Qualidade
do
1o
 Qualidade
do

                       cluster
         20o
cluster

      Por
u.lidade
    0.623
           0.543

      Por
expressão
   0.369
           0.169


•  70%
dos
genes
dos
5
melhores
clusters
por

   u.lidade
com
relação
conhecida
com
Câncer

   de
Próstata.

Agrupamento
Baseado
em

       U.lidade

Inferindo
Relações
Intergenes


Mais conteúdo relacionado

Semelhante a Mineração de Dados Genômicos com Open Biomind

Stabvida oportunidades profissionais
Stabvida oportunidades profissionaisStabvida oportunidades profissionais
Stabvida oportunidades profissionaisFrancisco Couto
 
Laboratório de Biotecnologia - Rna seq
Laboratório de Biotecnologia - Rna seqLaboratório de Biotecnologia - Rna seq
Laboratório de Biotecnologia - Rna seqGabriel Fernandes
 
Aula 2 - encontrando similaridades de sequências
Aula 2  - encontrando similaridades de sequênciasAula 2  - encontrando similaridades de sequências
Aula 2 - encontrando similaridades de sequênciasFrancisco Prosdocimi
 
Qualificação de Mestrado
Qualificação de MestradoQualificação de Mestrado
Qualificação de MestradoMiguel Galves
 
Por que preciso aprender algoritmo genético?
Por que preciso aprender algoritmo genético?Por que preciso aprender algoritmo genético?
Por que preciso aprender algoritmo genético?Jozias Rolim
 
Apresentação expotec
Apresentação expotecApresentação expotec
Apresentação expotecJozias Rolim
 
Palestra Marcos Vinicius Silva - Seminário ANCP 2014
Palestra Marcos Vinicius Silva - Seminário ANCP 2014Palestra Marcos Vinicius Silva - Seminário ANCP 2014
Palestra Marcos Vinicius Silva - Seminário ANCP 2014ANCP Ribeirão Preto
 
Indrodução a Bioinformática
Indrodução a BioinformáticaIndrodução a Bioinformática
Indrodução a BioinformáticaRicardo Leite
 

Semelhante a Mineração de Dados Genômicos com Open Biomind (10)

Stabvida oportunidades profissionais
Stabvida oportunidades profissionaisStabvida oportunidades profissionais
Stabvida oportunidades profissionais
 
Laboratório de Biotecnologia - Rna seq
Laboratório de Biotecnologia - Rna seqLaboratório de Biotecnologia - Rna seq
Laboratório de Biotecnologia - Rna seq
 
Aula 2 - encontrando similaridades de sequências
Aula 2  - encontrando similaridades de sequênciasAula 2  - encontrando similaridades de sequências
Aula 2 - encontrando similaridades de sequências
 
Anotação Gênica Funcional
Anotação Gênica FuncionalAnotação Gênica Funcional
Anotação Gênica Funcional
 
Minicurso 2013
Minicurso 2013Minicurso 2013
Minicurso 2013
 
Qualificação de Mestrado
Qualificação de MestradoQualificação de Mestrado
Qualificação de Mestrado
 
Por que preciso aprender algoritmo genético?
Por que preciso aprender algoritmo genético?Por que preciso aprender algoritmo genético?
Por que preciso aprender algoritmo genético?
 
Apresentação expotec
Apresentação expotecApresentação expotec
Apresentação expotec
 
Palestra Marcos Vinicius Silva - Seminário ANCP 2014
Palestra Marcos Vinicius Silva - Seminário ANCP 2014Palestra Marcos Vinicius Silva - Seminário ANCP 2014
Palestra Marcos Vinicius Silva - Seminário ANCP 2014
 
Indrodução a Bioinformática
Indrodução a BioinformáticaIndrodução a Bioinformática
Indrodução a Bioinformática
 

Último

Texto dramático com Estrutura e exemplos.ppt
Texto dramático com Estrutura e exemplos.pptTexto dramático com Estrutura e exemplos.ppt
Texto dramático com Estrutura e exemplos.pptjricardo76
 
Aula 1 - Psicologia Cognitiva, aula .ppt
Aula 1 - Psicologia Cognitiva, aula .pptAula 1 - Psicologia Cognitiva, aula .ppt
Aula 1 - Psicologia Cognitiva, aula .pptNathaliaFreitas32
 
Currículo - Ícaro Kleisson - Tutor acadêmico.pdf
Currículo - Ícaro Kleisson - Tutor acadêmico.pdfCurrículo - Ícaro Kleisson - Tutor acadêmico.pdf
Currículo - Ícaro Kleisson - Tutor acadêmico.pdfTutor de matemática Ícaro
 
O que é arte. Definição de arte. História da arte.
O que é arte. Definição de arte. História da arte.O que é arte. Definição de arte. História da arte.
O que é arte. Definição de arte. História da arte.denisecompasso2
 
Renascimento Cultural na Idade Moderna PDF
Renascimento Cultural na Idade Moderna PDFRenascimento Cultural na Idade Moderna PDF
Renascimento Cultural na Idade Moderna PDFRafaelaMartins72608
 
Monoteísmo, Politeísmo, Panteísmo 7 ANO2.pptx
Monoteísmo, Politeísmo, Panteísmo 7 ANO2.pptxMonoteísmo, Politeísmo, Panteísmo 7 ANO2.pptx
Monoteísmo, Politeísmo, Panteísmo 7 ANO2.pptxFlviaGomes64
 
M0 Atendimento – Definição, Importância .pptx
M0 Atendimento – Definição, Importância .pptxM0 Atendimento – Definição, Importância .pptx
M0 Atendimento – Definição, Importância .pptxJustinoTeixeira1
 
atividade-de-portugues-paronimos-e-homonimos-4º-e-5º-ano-respostas.pdf
atividade-de-portugues-paronimos-e-homonimos-4º-e-5º-ano-respostas.pdfatividade-de-portugues-paronimos-e-homonimos-4º-e-5º-ano-respostas.pdf
atividade-de-portugues-paronimos-e-homonimos-4º-e-5º-ano-respostas.pdfAutonoma
 
Expansão Marítima- Descobrimentos Portugueses século XV
Expansão Marítima- Descobrimentos Portugueses século XVExpansão Marítima- Descobrimentos Portugueses século XV
Expansão Marítima- Descobrimentos Portugueses século XVlenapinto
 
Plano de aula Nova Escola períodos simples e composto parte 1.pptx
Plano de aula Nova Escola períodos simples e composto parte 1.pptxPlano de aula Nova Escola períodos simples e composto parte 1.pptx
Plano de aula Nova Escola períodos simples e composto parte 1.pptxPaulaYaraDaasPedro
 
Apresentação ISBET Jovem Aprendiz e Estágio 2023.pdf
Apresentação ISBET Jovem Aprendiz e Estágio 2023.pdfApresentação ISBET Jovem Aprendiz e Estágio 2023.pdf
Apresentação ISBET Jovem Aprendiz e Estágio 2023.pdfcomercial400681
 
Os editoriais, reportagens e entrevistas.pptx
Os editoriais, reportagens e entrevistas.pptxOs editoriais, reportagens e entrevistas.pptx
Os editoriais, reportagens e entrevistas.pptxTailsonSantos1
 
Conflitos entre: ISRAEL E PALESTINA.pdf
Conflitos entre:  ISRAEL E PALESTINA.pdfConflitos entre:  ISRAEL E PALESTINA.pdf
Conflitos entre: ISRAEL E PALESTINA.pdfjacquescardosodias
 
6ano variação linguística ensino fundamental.pptx
6ano variação linguística ensino fundamental.pptx6ano variação linguística ensino fundamental.pptx
6ano variação linguística ensino fundamental.pptxJssicaCassiano2
 
Slides Lição 6, Betel, Ordenança para uma vida de obediência e submissão.pptx
Slides Lição 6, Betel, Ordenança para uma vida de obediência e submissão.pptxSlides Lição 6, Betel, Ordenança para uma vida de obediência e submissão.pptx
Slides Lição 6, Betel, Ordenança para uma vida de obediência e submissão.pptxLuizHenriquedeAlmeid6
 
Apresentação | Dia da Europa 2024 - Celebremos a União Europeia!
Apresentação | Dia da Europa 2024 - Celebremos a União Europeia!Apresentação | Dia da Europa 2024 - Celebremos a União Europeia!
Apresentação | Dia da Europa 2024 - Celebremos a União Europeia!Centro Jacques Delors
 
Polígonos, Diagonais de um Polígono, SOMA DOS ANGULOS INTERNOS DE UM POLÍGON...
Polígonos, Diagonais de um Polígono, SOMA DOS ANGULOS INTERNOS DE UM  POLÍGON...Polígonos, Diagonais de um Polígono, SOMA DOS ANGULOS INTERNOS DE UM  POLÍGON...
Polígonos, Diagonais de um Polígono, SOMA DOS ANGULOS INTERNOS DE UM POLÍGON...marcelafinkler
 
Slides Lição 6, CPAD, As Nossas Armas Espirituais, 2Tr24.pptx
Slides Lição 6, CPAD, As Nossas Armas Espirituais, 2Tr24.pptxSlides Lição 6, CPAD, As Nossas Armas Espirituais, 2Tr24.pptx
Slides Lição 6, CPAD, As Nossas Armas Espirituais, 2Tr24.pptxLuizHenriquedeAlmeid6
 
Pesquisa Ação René Barbier Livro acadêmico
Pesquisa Ação René Barbier Livro  acadêmicoPesquisa Ação René Barbier Livro  acadêmico
Pesquisa Ação René Barbier Livro acadêmicolourivalcaburite
 
P P P 2024 - *CIEJA Santana / Tucuruvi*
P P P 2024  - *CIEJA Santana / Tucuruvi*P P P 2024  - *CIEJA Santana / Tucuruvi*
P P P 2024 - *CIEJA Santana / Tucuruvi*Viviane Moreiras
 

Último (20)

Texto dramático com Estrutura e exemplos.ppt
Texto dramático com Estrutura e exemplos.pptTexto dramático com Estrutura e exemplos.ppt
Texto dramático com Estrutura e exemplos.ppt
 
Aula 1 - Psicologia Cognitiva, aula .ppt
Aula 1 - Psicologia Cognitiva, aula .pptAula 1 - Psicologia Cognitiva, aula .ppt
Aula 1 - Psicologia Cognitiva, aula .ppt
 
Currículo - Ícaro Kleisson - Tutor acadêmico.pdf
Currículo - Ícaro Kleisson - Tutor acadêmico.pdfCurrículo - Ícaro Kleisson - Tutor acadêmico.pdf
Currículo - Ícaro Kleisson - Tutor acadêmico.pdf
 
O que é arte. Definição de arte. História da arte.
O que é arte. Definição de arte. História da arte.O que é arte. Definição de arte. História da arte.
O que é arte. Definição de arte. História da arte.
 
Renascimento Cultural na Idade Moderna PDF
Renascimento Cultural na Idade Moderna PDFRenascimento Cultural na Idade Moderna PDF
Renascimento Cultural na Idade Moderna PDF
 
Monoteísmo, Politeísmo, Panteísmo 7 ANO2.pptx
Monoteísmo, Politeísmo, Panteísmo 7 ANO2.pptxMonoteísmo, Politeísmo, Panteísmo 7 ANO2.pptx
Monoteísmo, Politeísmo, Panteísmo 7 ANO2.pptx
 
M0 Atendimento – Definição, Importância .pptx
M0 Atendimento – Definição, Importância .pptxM0 Atendimento – Definição, Importância .pptx
M0 Atendimento – Definição, Importância .pptx
 
atividade-de-portugues-paronimos-e-homonimos-4º-e-5º-ano-respostas.pdf
atividade-de-portugues-paronimos-e-homonimos-4º-e-5º-ano-respostas.pdfatividade-de-portugues-paronimos-e-homonimos-4º-e-5º-ano-respostas.pdf
atividade-de-portugues-paronimos-e-homonimos-4º-e-5º-ano-respostas.pdf
 
Expansão Marítima- Descobrimentos Portugueses século XV
Expansão Marítima- Descobrimentos Portugueses século XVExpansão Marítima- Descobrimentos Portugueses século XV
Expansão Marítima- Descobrimentos Portugueses século XV
 
Plano de aula Nova Escola períodos simples e composto parte 1.pptx
Plano de aula Nova Escola períodos simples e composto parte 1.pptxPlano de aula Nova Escola períodos simples e composto parte 1.pptx
Plano de aula Nova Escola períodos simples e composto parte 1.pptx
 
Apresentação ISBET Jovem Aprendiz e Estágio 2023.pdf
Apresentação ISBET Jovem Aprendiz e Estágio 2023.pdfApresentação ISBET Jovem Aprendiz e Estágio 2023.pdf
Apresentação ISBET Jovem Aprendiz e Estágio 2023.pdf
 
Os editoriais, reportagens e entrevistas.pptx
Os editoriais, reportagens e entrevistas.pptxOs editoriais, reportagens e entrevistas.pptx
Os editoriais, reportagens e entrevistas.pptx
 
Conflitos entre: ISRAEL E PALESTINA.pdf
Conflitos entre:  ISRAEL E PALESTINA.pdfConflitos entre:  ISRAEL E PALESTINA.pdf
Conflitos entre: ISRAEL E PALESTINA.pdf
 
6ano variação linguística ensino fundamental.pptx
6ano variação linguística ensino fundamental.pptx6ano variação linguística ensino fundamental.pptx
6ano variação linguística ensino fundamental.pptx
 
Slides Lição 6, Betel, Ordenança para uma vida de obediência e submissão.pptx
Slides Lição 6, Betel, Ordenança para uma vida de obediência e submissão.pptxSlides Lição 6, Betel, Ordenança para uma vida de obediência e submissão.pptx
Slides Lição 6, Betel, Ordenança para uma vida de obediência e submissão.pptx
 
Apresentação | Dia da Europa 2024 - Celebremos a União Europeia!
Apresentação | Dia da Europa 2024 - Celebremos a União Europeia!Apresentação | Dia da Europa 2024 - Celebremos a União Europeia!
Apresentação | Dia da Europa 2024 - Celebremos a União Europeia!
 
Polígonos, Diagonais de um Polígono, SOMA DOS ANGULOS INTERNOS DE UM POLÍGON...
Polígonos, Diagonais de um Polígono, SOMA DOS ANGULOS INTERNOS DE UM  POLÍGON...Polígonos, Diagonais de um Polígono, SOMA DOS ANGULOS INTERNOS DE UM  POLÍGON...
Polígonos, Diagonais de um Polígono, SOMA DOS ANGULOS INTERNOS DE UM POLÍGON...
 
Slides Lição 6, CPAD, As Nossas Armas Espirituais, 2Tr24.pptx
Slides Lição 6, CPAD, As Nossas Armas Espirituais, 2Tr24.pptxSlides Lição 6, CPAD, As Nossas Armas Espirituais, 2Tr24.pptx
Slides Lição 6, CPAD, As Nossas Armas Espirituais, 2Tr24.pptx
 
Pesquisa Ação René Barbier Livro acadêmico
Pesquisa Ação René Barbier Livro  acadêmicoPesquisa Ação René Barbier Livro  acadêmico
Pesquisa Ação René Barbier Livro acadêmico
 
P P P 2024 - *CIEJA Santana / Tucuruvi*
P P P 2024  - *CIEJA Santana / Tucuruvi*P P P 2024  - *CIEJA Santana / Tucuruvi*
P P P 2024 - *CIEJA Santana / Tucuruvi*
 

Mineração de Dados Genômicos com Open Biomind