Alinhamento Múltiplo
Docente: Prof. Dr. Artur Trancoso
Ayala Lemos
Jairo Rego
Jefferson Maia
Marcos Vinícius
Naan Cardoso
Mestrado em Computação Aplicada
Definição
O alinhamento de sequências consiste no
processo de comparar duas ou mais
sequências (de nucleotídeos ou aminoácidos)
de forma a se observar seu nível de
similaridade
 Comparação de strings
Identificação de substrings
compartilhadas
Uma das mais poderosas técnicas da
bioinformática
Alinhamento Múltiplo
• Aquele realizado entre MAIS DE DUAS sequências de DNA ou proteínas
Seq1 ------------------------------------------------------------
Seq4 -GCACGAGGACTGTGA-----ACCGAATCGGTTCAGTAAAATGTTCAATTGTGCGCTGGA
Seq2 ------------------------------GTTCAGTAAAATGTTCAATTGTGCGCTGGA
Seq3 GGCACGAGGGCTACGACTGTGAACGAATCGGTTCAGTAAAATGTTCAATTGTGCGCTGGA
Seq1 ------------------------------------------------------------
Seq4 ATCTATTGTGTAGACTATTAACTATGGAATTTTACTTCACATTGACTAAAAAGCTGAGCA
Seq2 ATCTATTGTGTAGACT-TTAACTATGGAATTTTACTTCACATTGACTAAAAAGCTGAGCA
Seq3 ATCTATTGTGTAGACTATTAACTATGGAATTTTACTTCACATT-ACTAAAAAGCTGAGCA
Seq1 ---------------------CTTTCAAGATGAACGAACCAACTGGTGTCGGGCCAACAT
Seq4 AATATACCTGGAGCGTTCAGACTTTCAAGATGAACGAACCAACTGGTGTCGGGCCAACAT
Seq2 AATATACCTGGAGCGTTCAGACTTTCAAGATGAACGAACCAACTGGTGTCGGGCCAACAT
Seq3 AATATACCTGGAGCGTTCAGACTTTCAAGATGAACGAACCAACTGGTGTCGGGCCAACAT
***************************************
Importância dos alinhamentos múltiplos
• Para revelar os relacionamentos entre um grupo de sequências
(homologia).
• Para caracterizar famílias protéicas – identificar regiões conservadas e
determinar as regiões variáveis.
• Regiões similares podem indicar funções similares (por exemplo,
promotores no DNA).
• Um alinhamento múltiplo, seja de sequências de DNA ou de proteína,
pode fornecer muito mais informação do que uma única sequência.
Importância dos alinhamentos múltiplos
• Quando lidando com uma nova proteína, de função desconhecida, a
presença de domínios similares a outros em proteínas conhecidas
pode implicar em função ou estrutura semelhante.
• Planejar mutações pontuais, desenhar primers e/ou sondas especiais.
• Construir um perfil da família, o que possibilitará buscas mais
avançadas, capazes de localizar membros mais distantes da mesma
família.
Alinhamentos Global e Local
• Global: as seqs são alinhadas de ponta a ponta
• Local: pedaços das seqs é que são comparados
Qual deles
é melhor?
Alinhamentos ótimo e heurístico
• heurística -- do dicionário Houaiss
Acepções
¦ substantivo feminino
1 arte de inventar, de fazer descobertas; ciência que tem por objeto a descoberta dos fatos
1.1 Rubrica: história.
ramo da História voltado à pesquisa de fontes e documentos
1.2 Rubrica: informática.
método de investigação baseado na aproximação progressiva de um dado problema
1.3 Rubrica: pedagogia.
método educacional que consiste em fazer descobrir pelo aluno o que se lhe quer ensinar
LOGO:
• Alinhamento ótimo: produz o melhor resultado computacionalmente possível
• Alinhamento heurístico: produz um resultado o mais próximo possível do
resultado ótimo, mas, principalmente, produz um resultado de maneira muito
veloz
Função de Pontuação
• Método padrão para pontuar o alinhamento múltiplo
• SP é uma função, coluna por coluna, do peso do alinhamento.
• Usa matriz de substituição.
• O score total do alinhamento múltiplo é encontrado pelo score
encontrado em cada coluna.
Dividir e conquistar Alinhamento de sequências
Múltiplas (DCA)
• È um programa para a produção rápida e de alta qualidade e de
simultâneos múltiplos alinhamentos de sequências de aminoácidos,
RNA ou sequências de DNA.
• O programa baseia-se no algoritmo de DCA, uma abordagem
heurística para soma de pares (SP).
Alinhamento Iterativo - Naan
• É baseado na ideia de que uma solução ótima pode ser encontrada
através da modificação repetidamente de soluções sub ótimas
existentes.
• Os métodos iterativos obviam esta situação através de repetidos
passos de alinhamento global, com vista à otimização do score (por
exemplo SP).
• PRRP/PRRN: refinamento iterativo de um alinhamento progressivo
com construção de árvore e uso de pesos no alinhamento de pares.
http://prrn.ims.u-tokyo.ac.jp/, http://prrn.hgc.jp,
• http://bibiserv.techfak.uni-bielefeld.de/dialign
Faz pesquisa de alinhamentos locais sem gaps em pares de sequências,
pesados para o cálculo e otimização do alinhamento final.
PRRN

Alinhamento multiplo

  • 1.
    Alinhamento Múltiplo Docente: Prof.Dr. Artur Trancoso Ayala Lemos Jairo Rego Jefferson Maia Marcos Vinícius Naan Cardoso Mestrado em Computação Aplicada
  • 2.
    Definição O alinhamento desequências consiste no processo de comparar duas ou mais sequências (de nucleotídeos ou aminoácidos) de forma a se observar seu nível de similaridade  Comparação de strings Identificação de substrings compartilhadas Uma das mais poderosas técnicas da bioinformática
  • 3.
    Alinhamento Múltiplo • Aquelerealizado entre MAIS DE DUAS sequências de DNA ou proteínas Seq1 ------------------------------------------------------------ Seq4 -GCACGAGGACTGTGA-----ACCGAATCGGTTCAGTAAAATGTTCAATTGTGCGCTGGA Seq2 ------------------------------GTTCAGTAAAATGTTCAATTGTGCGCTGGA Seq3 GGCACGAGGGCTACGACTGTGAACGAATCGGTTCAGTAAAATGTTCAATTGTGCGCTGGA Seq1 ------------------------------------------------------------ Seq4 ATCTATTGTGTAGACTATTAACTATGGAATTTTACTTCACATTGACTAAAAAGCTGAGCA Seq2 ATCTATTGTGTAGACT-TTAACTATGGAATTTTACTTCACATTGACTAAAAAGCTGAGCA Seq3 ATCTATTGTGTAGACTATTAACTATGGAATTTTACTTCACATT-ACTAAAAAGCTGAGCA Seq1 ---------------------CTTTCAAGATGAACGAACCAACTGGTGTCGGGCCAACAT Seq4 AATATACCTGGAGCGTTCAGACTTTCAAGATGAACGAACCAACTGGTGTCGGGCCAACAT Seq2 AATATACCTGGAGCGTTCAGACTTTCAAGATGAACGAACCAACTGGTGTCGGGCCAACAT Seq3 AATATACCTGGAGCGTTCAGACTTTCAAGATGAACGAACCAACTGGTGTCGGGCCAACAT ***************************************
  • 4.
    Importância dos alinhamentosmúltiplos • Para revelar os relacionamentos entre um grupo de sequências (homologia). • Para caracterizar famílias protéicas – identificar regiões conservadas e determinar as regiões variáveis. • Regiões similares podem indicar funções similares (por exemplo, promotores no DNA). • Um alinhamento múltiplo, seja de sequências de DNA ou de proteína, pode fornecer muito mais informação do que uma única sequência.
  • 5.
    Importância dos alinhamentosmúltiplos • Quando lidando com uma nova proteína, de função desconhecida, a presença de domínios similares a outros em proteínas conhecidas pode implicar em função ou estrutura semelhante. • Planejar mutações pontuais, desenhar primers e/ou sondas especiais. • Construir um perfil da família, o que possibilitará buscas mais avançadas, capazes de localizar membros mais distantes da mesma família.
  • 6.
    Alinhamentos Global eLocal • Global: as seqs são alinhadas de ponta a ponta • Local: pedaços das seqs é que são comparados Qual deles é melhor?
  • 7.
    Alinhamentos ótimo eheurístico • heurística -- do dicionário Houaiss Acepções ¦ substantivo feminino 1 arte de inventar, de fazer descobertas; ciência que tem por objeto a descoberta dos fatos 1.1 Rubrica: história. ramo da História voltado à pesquisa de fontes e documentos 1.2 Rubrica: informática. método de investigação baseado na aproximação progressiva de um dado problema 1.3 Rubrica: pedagogia. método educacional que consiste em fazer descobrir pelo aluno o que se lhe quer ensinar LOGO: • Alinhamento ótimo: produz o melhor resultado computacionalmente possível • Alinhamento heurístico: produz um resultado o mais próximo possível do resultado ótimo, mas, principalmente, produz um resultado de maneira muito veloz
  • 8.
    Função de Pontuação •Método padrão para pontuar o alinhamento múltiplo • SP é uma função, coluna por coluna, do peso do alinhamento. • Usa matriz de substituição. • O score total do alinhamento múltiplo é encontrado pelo score encontrado em cada coluna.
  • 9.
    Dividir e conquistarAlinhamento de sequências Múltiplas (DCA) • È um programa para a produção rápida e de alta qualidade e de simultâneos múltiplos alinhamentos de sequências de aminoácidos, RNA ou sequências de DNA. • O programa baseia-se no algoritmo de DCA, uma abordagem heurística para soma de pares (SP).
  • 10.
    Alinhamento Iterativo -Naan • É baseado na ideia de que uma solução ótima pode ser encontrada através da modificação repetidamente de soluções sub ótimas existentes. • Os métodos iterativos obviam esta situação através de repetidos passos de alinhamento global, com vista à otimização do score (por exemplo SP).
  • 11.
    • PRRP/PRRN: refinamentoiterativo de um alinhamento progressivo com construção de árvore e uso de pesos no alinhamento de pares. http://prrn.ims.u-tokyo.ac.jp/, http://prrn.hgc.jp, • http://bibiserv.techfak.uni-bielefeld.de/dialign Faz pesquisa de alinhamentos locais sem gaps em pares de sequências, pesados para o cálculo e otimização do alinhamento final.
  • 12.