O documento discute técnicas de alinhamento múltiplo de sequências de DNA e proteínas, comparando alinhamentos globais e locais, ótimos e heurísticos. Também apresenta métodos como Dividir e Conquistar, Alinhamento Iterativo e PRRN para produzir alinhamentos múltiplos de alta qualidade de forma rápida.
1. Alinhamento Múltiplo
Docente: Prof. Dr. Artur Trancoso
Ayala Lemos
Jairo Rego
Jefferson Maia
Marcos Vinícius
Naan Cardoso
Mestrado em Computação Aplicada
2. Definição
O alinhamento de sequências consiste no
processo de comparar duas ou mais
sequências (de nucleotídeos ou aminoácidos)
de forma a se observar seu nível de
similaridade
Comparação de strings
Identificação de substrings
compartilhadas
Uma das mais poderosas técnicas da
bioinformática
3. Alinhamento Múltiplo
• Aquele realizado entre MAIS DE DUAS sequências de DNA ou proteínas
Seq1 ------------------------------------------------------------
Seq4 -GCACGAGGACTGTGA-----ACCGAATCGGTTCAGTAAAATGTTCAATTGTGCGCTGGA
Seq2 ------------------------------GTTCAGTAAAATGTTCAATTGTGCGCTGGA
Seq3 GGCACGAGGGCTACGACTGTGAACGAATCGGTTCAGTAAAATGTTCAATTGTGCGCTGGA
Seq1 ------------------------------------------------------------
Seq4 ATCTATTGTGTAGACTATTAACTATGGAATTTTACTTCACATTGACTAAAAAGCTGAGCA
Seq2 ATCTATTGTGTAGACT-TTAACTATGGAATTTTACTTCACATTGACTAAAAAGCTGAGCA
Seq3 ATCTATTGTGTAGACTATTAACTATGGAATTTTACTTCACATT-ACTAAAAAGCTGAGCA
Seq1 ---------------------CTTTCAAGATGAACGAACCAACTGGTGTCGGGCCAACAT
Seq4 AATATACCTGGAGCGTTCAGACTTTCAAGATGAACGAACCAACTGGTGTCGGGCCAACAT
Seq2 AATATACCTGGAGCGTTCAGACTTTCAAGATGAACGAACCAACTGGTGTCGGGCCAACAT
Seq3 AATATACCTGGAGCGTTCAGACTTTCAAGATGAACGAACCAACTGGTGTCGGGCCAACAT
***************************************
4. Importância dos alinhamentos múltiplos
• Para revelar os relacionamentos entre um grupo de sequências
(homologia).
• Para caracterizar famílias protéicas – identificar regiões conservadas e
determinar as regiões variáveis.
• Regiões similares podem indicar funções similares (por exemplo,
promotores no DNA).
• Um alinhamento múltiplo, seja de sequências de DNA ou de proteína,
pode fornecer muito mais informação do que uma única sequência.
5. Importância dos alinhamentos múltiplos
• Quando lidando com uma nova proteína, de função desconhecida, a
presença de domínios similares a outros em proteínas conhecidas
pode implicar em função ou estrutura semelhante.
• Planejar mutações pontuais, desenhar primers e/ou sondas especiais.
• Construir um perfil da família, o que possibilitará buscas mais
avançadas, capazes de localizar membros mais distantes da mesma
família.
6. Alinhamentos Global e Local
• Global: as seqs são alinhadas de ponta a ponta
• Local: pedaços das seqs é que são comparados
Qual deles
é melhor?
7. Alinhamentos ótimo e heurístico
• heurística -- do dicionário Houaiss
Acepções
¦ substantivo feminino
1 arte de inventar, de fazer descobertas; ciência que tem por objeto a descoberta dos fatos
1.1 Rubrica: história.
ramo da História voltado à pesquisa de fontes e documentos
1.2 Rubrica: informática.
método de investigação baseado na aproximação progressiva de um dado problema
1.3 Rubrica: pedagogia.
método educacional que consiste em fazer descobrir pelo aluno o que se lhe quer ensinar
LOGO:
• Alinhamento ótimo: produz o melhor resultado computacionalmente possível
• Alinhamento heurístico: produz um resultado o mais próximo possível do
resultado ótimo, mas, principalmente, produz um resultado de maneira muito
veloz
8. Função de Pontuação
• Método padrão para pontuar o alinhamento múltiplo
• SP é uma função, coluna por coluna, do peso do alinhamento.
• Usa matriz de substituição.
• O score total do alinhamento múltiplo é encontrado pelo score
encontrado em cada coluna.
9. Dividir e conquistar Alinhamento de sequências
Múltiplas (DCA)
• È um programa para a produção rápida e de alta qualidade e de
simultâneos múltiplos alinhamentos de sequências de aminoácidos,
RNA ou sequências de DNA.
• O programa baseia-se no algoritmo de DCA, uma abordagem
heurística para soma de pares (SP).
10. Alinhamento Iterativo - Naan
• É baseado na ideia de que uma solução ótima pode ser encontrada
através da modificação repetidamente de soluções sub ótimas
existentes.
• Os métodos iterativos obviam esta situação através de repetidos
passos de alinhamento global, com vista à otimização do score (por
exemplo SP).
11. • PRRP/PRRN: refinamento iterativo de um alinhamento progressivo
com construção de árvore e uso de pesos no alinhamento de pares.
http://prrn.ims.u-tokyo.ac.jp/, http://prrn.hgc.jp,
• http://bibiserv.techfak.uni-bielefeld.de/dialign
Faz pesquisa de alinhamentos locais sem gaps em pares de sequências,
pesados para o cálculo e otimização do alinhamento final.