SlideShare uma empresa Scribd logo
1 de 12
Alinhamento Múltiplo
Docente: Prof. Dr. Artur Trancoso
Ayala Lemos
Jairo Rego
Jefferson Maia
Marcos Vinícius
Naan Cardoso
Mestrado em Computação Aplicada
Definição
O alinhamento de sequências consiste no
processo de comparar duas ou mais
sequências (de nucleotídeos ou aminoácidos)
de forma a se observar seu nível de
similaridade
 Comparação de strings
Identificação de substrings
compartilhadas
Uma das mais poderosas técnicas da
bioinformática
Alinhamento Múltiplo
• Aquele realizado entre MAIS DE DUAS sequências de DNA ou proteínas
Seq1 ------------------------------------------------------------
Seq4 -GCACGAGGACTGTGA-----ACCGAATCGGTTCAGTAAAATGTTCAATTGTGCGCTGGA
Seq2 ------------------------------GTTCAGTAAAATGTTCAATTGTGCGCTGGA
Seq3 GGCACGAGGGCTACGACTGTGAACGAATCGGTTCAGTAAAATGTTCAATTGTGCGCTGGA
Seq1 ------------------------------------------------------------
Seq4 ATCTATTGTGTAGACTATTAACTATGGAATTTTACTTCACATTGACTAAAAAGCTGAGCA
Seq2 ATCTATTGTGTAGACT-TTAACTATGGAATTTTACTTCACATTGACTAAAAAGCTGAGCA
Seq3 ATCTATTGTGTAGACTATTAACTATGGAATTTTACTTCACATT-ACTAAAAAGCTGAGCA
Seq1 ---------------------CTTTCAAGATGAACGAACCAACTGGTGTCGGGCCAACAT
Seq4 AATATACCTGGAGCGTTCAGACTTTCAAGATGAACGAACCAACTGGTGTCGGGCCAACAT
Seq2 AATATACCTGGAGCGTTCAGACTTTCAAGATGAACGAACCAACTGGTGTCGGGCCAACAT
Seq3 AATATACCTGGAGCGTTCAGACTTTCAAGATGAACGAACCAACTGGTGTCGGGCCAACAT
***************************************
Importância dos alinhamentos múltiplos
• Para revelar os relacionamentos entre um grupo de sequências
(homologia).
• Para caracterizar famílias protéicas – identificar regiões conservadas e
determinar as regiões variáveis.
• Regiões similares podem indicar funções similares (por exemplo,
promotores no DNA).
• Um alinhamento múltiplo, seja de sequências de DNA ou de proteína,
pode fornecer muito mais informação do que uma única sequência.
Importância dos alinhamentos múltiplos
• Quando lidando com uma nova proteína, de função desconhecida, a
presença de domínios similares a outros em proteínas conhecidas
pode implicar em função ou estrutura semelhante.
• Planejar mutações pontuais, desenhar primers e/ou sondas especiais.
• Construir um perfil da família, o que possibilitará buscas mais
avançadas, capazes de localizar membros mais distantes da mesma
família.
Alinhamentos Global e Local
• Global: as seqs são alinhadas de ponta a ponta
• Local: pedaços das seqs é que são comparados
Qual deles
é melhor?
Alinhamentos ótimo e heurístico
• heurística -- do dicionário Houaiss
Acepções
¦ substantivo feminino
1 arte de inventar, de fazer descobertas; ciência que tem por objeto a descoberta dos fatos
1.1 Rubrica: história.
ramo da História voltado à pesquisa de fontes e documentos
1.2 Rubrica: informática.
método de investigação baseado na aproximação progressiva de um dado problema
1.3 Rubrica: pedagogia.
método educacional que consiste em fazer descobrir pelo aluno o que se lhe quer ensinar
LOGO:
• Alinhamento ótimo: produz o melhor resultado computacionalmente possível
• Alinhamento heurístico: produz um resultado o mais próximo possível do
resultado ótimo, mas, principalmente, produz um resultado de maneira muito
veloz
Função de Pontuação
• Método padrão para pontuar o alinhamento múltiplo
• SP é uma função, coluna por coluna, do peso do alinhamento.
• Usa matriz de substituição.
• O score total do alinhamento múltiplo é encontrado pelo score
encontrado em cada coluna.
Dividir e conquistar Alinhamento de sequências
Múltiplas (DCA)
• È um programa para a produção rápida e de alta qualidade e de
simultâneos múltiplos alinhamentos de sequências de aminoácidos,
RNA ou sequências de DNA.
• O programa baseia-se no algoritmo de DCA, uma abordagem
heurística para soma de pares (SP).
Alinhamento Iterativo - Naan
• É baseado na ideia de que uma solução ótima pode ser encontrada
através da modificação repetidamente de soluções sub ótimas
existentes.
• Os métodos iterativos obviam esta situação através de repetidos
passos de alinhamento global, com vista à otimização do score (por
exemplo SP).
• PRRP/PRRN: refinamento iterativo de um alinhamento progressivo
com construção de árvore e uso de pesos no alinhamento de pares.
http://prrn.ims.u-tokyo.ac.jp/, http://prrn.hgc.jp,
• http://bibiserv.techfak.uni-bielefeld.de/dialign
Faz pesquisa de alinhamentos locais sem gaps em pares de sequências,
pesados para o cálculo e otimização do alinhamento final.
PRRN

Mais conteúdo relacionado

Mais procurados

Tradução - síntese proteica
Tradução - síntese proteicaTradução - síntese proteica
Tradução - síntese proteicaceap
 
Seleção Tradicional vs. Seleção Genômica
Seleção Tradicional vs. Seleção Genômica Seleção Tradicional vs. Seleção Genômica
Seleção Tradicional vs. Seleção Genômica ANCP Ribeirão Preto
 
PCR- Reação em cadeia pela DNA POLIMERASE!
PCR- Reação em cadeia pela DNA POLIMERASE!PCR- Reação em cadeia pela DNA POLIMERASE!
PCR- Reação em cadeia pela DNA POLIMERASE!Hemilly Rayanne
 
Reposta Imune Contra as Infecções
Reposta Imune Contra as InfecçõesReposta Imune Contra as Infecções
Reposta Imune Contra as InfecçõesLABIMUNO UFBA
 
Expressão heteróloga
Expressão heterólogaExpressão heteróloga
Expressão heterólogaIvson Cassiano
 
Replicação dna marília
Replicação dna   maríliaReplicação dna   marília
Replicação dna maríliaIaraChaves12345
 
Recombinação genetica
Recombinação geneticaRecombinação genetica
Recombinação geneticaUERGS
 
Regulação da expressão gênica em procariotos e eucariotos
Regulação da expressão gênica em procariotos e  eucariotosRegulação da expressão gênica em procariotos e  eucariotos
Regulação da expressão gênica em procariotos e eucariotosPriscila Rodrigues
 
ICSA17 - MHC e Apresentação de Antígenos
ICSA17 - MHC e Apresentação de AntígenosICSA17 - MHC e Apresentação de Antígenos
ICSA17 - MHC e Apresentação de AntígenosRicardo Portela
 
Inflamação crônica (reparo)
Inflamação crônica (reparo)Inflamação crônica (reparo)
Inflamação crônica (reparo)FAMENE 2018.2b
 
Manejo Reprodutivo de Equinos
Manejo Reprodutivo de EquinosManejo Reprodutivo de Equinos
Manejo Reprodutivo de EquinosKiller Max
 
Aula 3 leishmaniose e leishmania sp
Aula 3   leishmaniose e leishmania spAula 3   leishmaniose e leishmania sp
Aula 3 leishmaniose e leishmania spJoao Paulo Peixoto
 
Introdução a bioinformatica
Introdução a bioinformaticaIntrodução a bioinformatica
Introdução a bioinformaticaUERGS
 
Tecnologia do DNA recombinante
Tecnologia do DNA recombinanteTecnologia do DNA recombinante
Tecnologia do DNA recombinanteShaline Araújo
 

Mais procurados (20)

Tradução - síntese proteica
Tradução - síntese proteicaTradução - síntese proteica
Tradução - síntese proteica
 
Predição Gênica
Predição GênicaPredição Gênica
Predição Gênica
 
PCR
PCRPCR
PCR
 
Algoritmo BLAST
Algoritmo BLASTAlgoritmo BLAST
Algoritmo BLAST
 
Seleção Tradicional vs. Seleção Genômica
Seleção Tradicional vs. Seleção Genômica Seleção Tradicional vs. Seleção Genômica
Seleção Tradicional vs. Seleção Genômica
 
Montagem de Genomas
Montagem de GenomasMontagem de Genomas
Montagem de Genomas
 
PCR- Reação em cadeia pela DNA POLIMERASE!
PCR- Reação em cadeia pela DNA POLIMERASE!PCR- Reação em cadeia pela DNA POLIMERASE!
PCR- Reação em cadeia pela DNA POLIMERASE!
 
Reposta Imune Contra as Infecções
Reposta Imune Contra as InfecçõesReposta Imune Contra as Infecções
Reposta Imune Contra as Infecções
 
Expressão heteróloga
Expressão heterólogaExpressão heteróloga
Expressão heteróloga
 
Replicação dna marília
Replicação dna   maríliaReplicação dna   marília
Replicação dna marília
 
Manual do antibiograma
Manual do antibiograma Manual do antibiograma
Manual do antibiograma
 
Recombinação genetica
Recombinação geneticaRecombinação genetica
Recombinação genetica
 
Regulação da expressão gênica em procariotos e eucariotos
Regulação da expressão gênica em procariotos e  eucariotosRegulação da expressão gênica em procariotos e  eucariotos
Regulação da expressão gênica em procariotos e eucariotos
 
ICSA17 - MHC e Apresentação de Antígenos
ICSA17 - MHC e Apresentação de AntígenosICSA17 - MHC e Apresentação de Antígenos
ICSA17 - MHC e Apresentação de Antígenos
 
Inflamação crônica (reparo)
Inflamação crônica (reparo)Inflamação crônica (reparo)
Inflamação crônica (reparo)
 
Farmacologia uso-frequente-veterinaria
Farmacologia uso-frequente-veterinariaFarmacologia uso-frequente-veterinaria
Farmacologia uso-frequente-veterinaria
 
Manejo Reprodutivo de Equinos
Manejo Reprodutivo de EquinosManejo Reprodutivo de Equinos
Manejo Reprodutivo de Equinos
 
Aula 3 leishmaniose e leishmania sp
Aula 3   leishmaniose e leishmania spAula 3   leishmaniose e leishmania sp
Aula 3 leishmaniose e leishmania sp
 
Introdução a bioinformatica
Introdução a bioinformaticaIntrodução a bioinformatica
Introdução a bioinformatica
 
Tecnologia do DNA recombinante
Tecnologia do DNA recombinanteTecnologia do DNA recombinante
Tecnologia do DNA recombinante
 

Semelhante a Alinhamento multiplo

Algoritmos de Clusterização
Algoritmos de ClusterizaçãoAlgoritmos de Clusterização
Algoritmos de ClusterizaçãoGabriel Peixe
 
Aprendizado de Máquina para Classificação de Dados
Aprendizado de Máquina para Classificação de DadosAprendizado de Máquina para Classificação de Dados
Aprendizado de Máquina para Classificação de DadosDiego Negretto
 
Redes neurais e lógica fuzzy
Redes neurais e lógica fuzzyRedes neurais e lógica fuzzy
Redes neurais e lógica fuzzyRenato Ximenes
 
Introdução a redes neurais artificiais com a biblioteca encog
Introdução a redes neurais artificiais com a biblioteca encogIntrodução a redes neurais artificiais com a biblioteca encog
Introdução a redes neurais artificiais com a biblioteca encogRaquel Machado
 
Armazenamento, Indexação e Recuperação de Informação
Armazenamento, Indexação e Recuperação de InformaçãoArmazenamento, Indexação e Recuperação de Informação
Armazenamento, Indexação e Recuperação de InformaçãoMário Monteiro
 
A rede neural supervisionada chamada perceptron multicamadas
A rede neural supervisionada chamada perceptron multicamadasA rede neural supervisionada chamada perceptron multicamadas
A rede neural supervisionada chamada perceptron multicamadascesar do amaral
 
Agrupamento de sequências biológicas
Agrupamento de sequências biológicasAgrupamento de sequências biológicas
Agrupamento de sequências biológicasMarcos Castro
 
Aprendizado de Máquina Supervisionado na Predição de Links em Redes Complexas...
Aprendizado de Máquina Supervisionado na Predição de Links em Redes Complexas...Aprendizado de Máquina Supervisionado na Predição de Links em Redes Complexas...
Aprendizado de Máquina Supervisionado na Predição de Links em Redes Complexas...Orlando Junior
 
OTIMIZAÇÃO DE MÉTODOS DE PROVA EM TABLÔS KE ATRAVÉS DA APLICAÇÃO DE UMA HEURÍ...
OTIMIZAÇÃO DE MÉTODOS DE PROVA EM TABLÔS KE ATRAVÉS DA APLICAÇÃO DE UMA HEURÍ...OTIMIZAÇÃO DE MÉTODOS DE PROVA EM TABLÔS KE ATRAVÉS DA APLICAÇÃO DE UMA HEURÍ...
OTIMIZAÇÃO DE MÉTODOS DE PROVA EM TABLÔS KE ATRAVÉS DA APLICAÇÃO DE UMA HEURÍ...surfx
 
Java Style Grading
Java Style Grading Java Style Grading
Java Style Grading Natã Melo
 
topico_4.3_redes_RBF.pdf
topico_4.3_redes_RBF.pdftopico_4.3_redes_RBF.pdf
topico_4.3_redes_RBF.pdfDenicaLima
 
[TDC2016] Apache SparkMLlib: Machine Learning na Prática
[TDC2016] Apache SparkMLlib:  Machine Learning na Prática[TDC2016] Apache SparkMLlib:  Machine Learning na Prática
[TDC2016] Apache SparkMLlib: Machine Learning na PráticaEiti Kimura
 
Sistemas Inteligentes para Textos da Web
Sistemas Inteligentes para Textos da WebSistemas Inteligentes para Textos da Web
Sistemas Inteligentes para Textos da WebFernando Hideo Fukuda
 

Semelhante a Alinhamento multiplo (20)

Algoritmos de Clusterização
Algoritmos de ClusterizaçãoAlgoritmos de Clusterização
Algoritmos de Clusterização
 
160277 redes neurais artificiais
160277 redes neurais artificiais160277 redes neurais artificiais
160277 redes neurais artificiais
 
Aprendizado de Máquina para Classificação de Dados
Aprendizado de Máquina para Classificação de DadosAprendizado de Máquina para Classificação de Dados
Aprendizado de Máquina para Classificação de Dados
 
Redes neurais e lógica fuzzy
Redes neurais e lógica fuzzyRedes neurais e lógica fuzzy
Redes neurais e lógica fuzzy
 
Introdução a redes neurais artificiais com a biblioteca encog
Introdução a redes neurais artificiais com a biblioteca encogIntrodução a redes neurais artificiais com a biblioteca encog
Introdução a redes neurais artificiais com a biblioteca encog
 
Apresentacao
ApresentacaoApresentacao
Apresentacao
 
Armazenamento, Indexação e Recuperação de Informação
Armazenamento, Indexação e Recuperação de InformaçãoArmazenamento, Indexação e Recuperação de Informação
Armazenamento, Indexação e Recuperação de Informação
 
Classificador de imagens com redes neurais
Classificador de imagens com redes neuraisClassificador de imagens com redes neurais
Classificador de imagens com redes neurais
 
[Ottoni micro05] resume
[Ottoni micro05] resume[Ottoni micro05] resume
[Ottoni micro05] resume
 
Artigo tecnico RNA Iris
Artigo tecnico RNA IrisArtigo tecnico RNA Iris
Artigo tecnico RNA Iris
 
A rede neural supervisionada chamada perceptron multicamadas
A rede neural supervisionada chamada perceptron multicamadasA rede neural supervisionada chamada perceptron multicamadas
A rede neural supervisionada chamada perceptron multicamadas
 
Agrupamento de sequências biológicas
Agrupamento de sequências biológicasAgrupamento de sequências biológicas
Agrupamento de sequências biológicas
 
Aprendizado de Máquina Supervisionado na Predição de Links em Redes Complexas...
Aprendizado de Máquina Supervisionado na Predição de Links em Redes Complexas...Aprendizado de Máquina Supervisionado na Predição de Links em Redes Complexas...
Aprendizado de Máquina Supervisionado na Predição de Links em Redes Complexas...
 
OTIMIZAÇÃO DE MÉTODOS DE PROVA EM TABLÔS KE ATRAVÉS DA APLICAÇÃO DE UMA HEURÍ...
OTIMIZAÇÃO DE MÉTODOS DE PROVA EM TABLÔS KE ATRAVÉS DA APLICAÇÃO DE UMA HEURÍ...OTIMIZAÇÃO DE MÉTODOS DE PROVA EM TABLÔS KE ATRAVÉS DA APLICAÇÃO DE UMA HEURÍ...
OTIMIZAÇÃO DE MÉTODOS DE PROVA EM TABLÔS KE ATRAVÉS DA APLICAÇÃO DE UMA HEURÍ...
 
Java Style Grading
Java Style Grading Java Style Grading
Java Style Grading
 
Modelos de previsão de Ocorrências
Modelos de previsão de OcorrênciasModelos de previsão de Ocorrências
Modelos de previsão de Ocorrências
 
topico_4.3_redes_RBF.pdf
topico_4.3_redes_RBF.pdftopico_4.3_redes_RBF.pdf
topico_4.3_redes_RBF.pdf
 
High Dimensional Data
High Dimensional DataHigh Dimensional Data
High Dimensional Data
 
[TDC2016] Apache SparkMLlib: Machine Learning na Prática
[TDC2016] Apache SparkMLlib:  Machine Learning na Prática[TDC2016] Apache SparkMLlib:  Machine Learning na Prática
[TDC2016] Apache SparkMLlib: Machine Learning na Prática
 
Sistemas Inteligentes para Textos da Web
Sistemas Inteligentes para Textos da WebSistemas Inteligentes para Textos da Web
Sistemas Inteligentes para Textos da Web
 

Alinhamento multiplo

  • 1. Alinhamento Múltiplo Docente: Prof. Dr. Artur Trancoso Ayala Lemos Jairo Rego Jefferson Maia Marcos Vinícius Naan Cardoso Mestrado em Computação Aplicada
  • 2. Definição O alinhamento de sequências consiste no processo de comparar duas ou mais sequências (de nucleotídeos ou aminoácidos) de forma a se observar seu nível de similaridade  Comparação de strings Identificação de substrings compartilhadas Uma das mais poderosas técnicas da bioinformática
  • 3. Alinhamento Múltiplo • Aquele realizado entre MAIS DE DUAS sequências de DNA ou proteínas Seq1 ------------------------------------------------------------ Seq4 -GCACGAGGACTGTGA-----ACCGAATCGGTTCAGTAAAATGTTCAATTGTGCGCTGGA Seq2 ------------------------------GTTCAGTAAAATGTTCAATTGTGCGCTGGA Seq3 GGCACGAGGGCTACGACTGTGAACGAATCGGTTCAGTAAAATGTTCAATTGTGCGCTGGA Seq1 ------------------------------------------------------------ Seq4 ATCTATTGTGTAGACTATTAACTATGGAATTTTACTTCACATTGACTAAAAAGCTGAGCA Seq2 ATCTATTGTGTAGACT-TTAACTATGGAATTTTACTTCACATTGACTAAAAAGCTGAGCA Seq3 ATCTATTGTGTAGACTATTAACTATGGAATTTTACTTCACATT-ACTAAAAAGCTGAGCA Seq1 ---------------------CTTTCAAGATGAACGAACCAACTGGTGTCGGGCCAACAT Seq4 AATATACCTGGAGCGTTCAGACTTTCAAGATGAACGAACCAACTGGTGTCGGGCCAACAT Seq2 AATATACCTGGAGCGTTCAGACTTTCAAGATGAACGAACCAACTGGTGTCGGGCCAACAT Seq3 AATATACCTGGAGCGTTCAGACTTTCAAGATGAACGAACCAACTGGTGTCGGGCCAACAT ***************************************
  • 4. Importância dos alinhamentos múltiplos • Para revelar os relacionamentos entre um grupo de sequências (homologia). • Para caracterizar famílias protéicas – identificar regiões conservadas e determinar as regiões variáveis. • Regiões similares podem indicar funções similares (por exemplo, promotores no DNA). • Um alinhamento múltiplo, seja de sequências de DNA ou de proteína, pode fornecer muito mais informação do que uma única sequência.
  • 5. Importância dos alinhamentos múltiplos • Quando lidando com uma nova proteína, de função desconhecida, a presença de domínios similares a outros em proteínas conhecidas pode implicar em função ou estrutura semelhante. • Planejar mutações pontuais, desenhar primers e/ou sondas especiais. • Construir um perfil da família, o que possibilitará buscas mais avançadas, capazes de localizar membros mais distantes da mesma família.
  • 6. Alinhamentos Global e Local • Global: as seqs são alinhadas de ponta a ponta • Local: pedaços das seqs é que são comparados Qual deles é melhor?
  • 7. Alinhamentos ótimo e heurístico • heurística -- do dicionário Houaiss Acepções ¦ substantivo feminino 1 arte de inventar, de fazer descobertas; ciência que tem por objeto a descoberta dos fatos 1.1 Rubrica: história. ramo da História voltado à pesquisa de fontes e documentos 1.2 Rubrica: informática. método de investigação baseado na aproximação progressiva de um dado problema 1.3 Rubrica: pedagogia. método educacional que consiste em fazer descobrir pelo aluno o que se lhe quer ensinar LOGO: • Alinhamento ótimo: produz o melhor resultado computacionalmente possível • Alinhamento heurístico: produz um resultado o mais próximo possível do resultado ótimo, mas, principalmente, produz um resultado de maneira muito veloz
  • 8. Função de Pontuação • Método padrão para pontuar o alinhamento múltiplo • SP é uma função, coluna por coluna, do peso do alinhamento. • Usa matriz de substituição. • O score total do alinhamento múltiplo é encontrado pelo score encontrado em cada coluna.
  • 9. Dividir e conquistar Alinhamento de sequências Múltiplas (DCA) • È um programa para a produção rápida e de alta qualidade e de simultâneos múltiplos alinhamentos de sequências de aminoácidos, RNA ou sequências de DNA. • O programa baseia-se no algoritmo de DCA, uma abordagem heurística para soma de pares (SP).
  • 10. Alinhamento Iterativo - Naan • É baseado na ideia de que uma solução ótima pode ser encontrada através da modificação repetidamente de soluções sub ótimas existentes. • Os métodos iterativos obviam esta situação através de repetidos passos de alinhamento global, com vista à otimização do score (por exemplo SP).
  • 11. • PRRP/PRRN: refinamento iterativo de um alinhamento progressivo com construção de árvore e uso de pesos no alinhamento de pares. http://prrn.ims.u-tokyo.ac.jp/, http://prrn.hgc.jp, • http://bibiserv.techfak.uni-bielefeld.de/dialign Faz pesquisa de alinhamentos locais sem gaps em pares de sequências, pesados para o cálculo e otimização do alinhamento final.
  • 12. PRRN