Este documento introduz conceitos básicos sobre modelagem de proteínas por homologia em três pontos: (1) Apresenta noções sobre estrutura primária, secundária e terciária de proteínas, (2) Explica que a modelagem por homologia constrói modelos 3D de proteínas com base na similaridade de sequência com proteínas de estrutura conhecida, (3) Descreve as etapas típicas de modelagem por homologia: identificação de moldes homólogos, alinhamento de sequências, construção do modelo 3D
Aula teorica minicurso modelagem de proteinas por homologia
1. Introdução à Modelagem de
Proteínas por Homologia
MSc. Ronaldo Correia
Genética e Biologia Molecular - Bioinformática
Laboratório de Planejamento e Desenvolvimento de Fármacos – LPDF -
UFPa
Belém-PA
Novembro de 2012
2. Objetivos
Oferecer noções básicas sobre Proteínas;
Apresentar técnicas de modelagem de Proteínas;
Discutir a importância dessas técnicas para o
proteoma e planejamento de fármacos.
5. Seres protéicos
A vida está intimamente ligada às proteínas. Estas
moléculas especiais realizam as mais variadas funções no
nosso organismo tais como:
Transporte de nutrientes e metabólitos, catálise de reações
biológicas;
Apesar da complexidade de suas funções, as proteínas são
relativamente simples;
Repetições de 20 unidades básicas, os aminoácidos.
6. Proteínas x Meio Ambiente
Metano: 25 x maior potencial efeito estufa que
CO2
As arqueias metanogênicas são responsáveis
por 74% do metano liberado em nossa
atmosfera.
Metil coenzima redutase (MCR): catálise da
metanogênese.
LIMA, 2012
9. Aminoácido
Um aminoácido consiste em um caborno “central” com
uma ligação a grupo amino (-NH2), outra a um grupo
carboxila (-COOH), a terceira a um átomo de
hidrogênio e a quarta a uma cadeia lateral variável
Carbono α
11. Aminoácidos
Single- & three-letter amino acid codes
G Glycine Gly P Proline Pro
A Alanine Ala V Valine Val
L Leucine Leu I Isoleucine Ile
M Methionine Met C Cysteine Cys
F Phenylalanine Phe Y Tyrosine Tyr
W Tryptophan Trp H Histidine His
K Lysine Lys R Arginine Arg
Q Glutamine Gln N Asparagine Asn
E Glutamic Acid Glu D Aspartic Acid Asp
S Serine Ser T Threonine Thr
12. Classificação dos aminoácidos
Os aminoácidos podem ser classificados de
acordo com o grupo R como:
Alifáticos (não polares) – sem polos,sem carga;
Não carregados, polares – mas com eminência;
Carregados positivamente;
Carregados Negativamente.
17. Ligação Peptídica
Os peptídeos são biomoléculas formadas pela
ligação de dois ou mais aminoácidos através de
ligações do tipo amida. Os peptídeos são
resultantes do processamento de proteínas e
podem variar de 2 ou mais aminoácidos.
2 aminoácidos: Dipeptídeo
3 aminoácidos: Tripeptídeo
4 a 10 aminoácidos: Oligopeptídeo
10 a 100 aminoácidos: Polipeptídeo
mais de 100 aminoácidos: Proteína
29. Covalent Bond ~ 50 - 100kcal/mol
Ionic Bond ~ 5 - 80kcal/mol
Hydrogen Bond ~ 3 - 6kcal/mol
Hydrophobic Interaction ~ 0.5 -
3kcal/mol (not a bond per se)
Van der Waals Interaction ~ 1kcal/mol
30. Proteínas
Definição: são macromoléculas complexas,
compostas de aminoácidos, e necessárias
para os processos químicos que ocorrem nos
organismos vivos
Nos animais, as proteínas correspondem a
cerca de 80% do peso dos músculos
desidratados, cerca de 70% da pele e 90% do
sangue seco.
33. Estrutura Secundária
A estrutura secundária é uma função dos
ângulos formados pelas ligações peptídicas
que ligam os aminoácidos
A conformação espacial é mantida graças as
interações intermoleculares (ligação
hidrogênio) entre os hidrogênios dos grupos
amino e os átomos de oxigênio dos outros
amino ácidos.
34. -Hélice
É a forma mais comum de estrutura
secundária regular;
Caracteriza-se por uma hélice em
espiral formada por volta de 3 a 6
aminoácidos;
As cadeias laterais dos aminoácidos
se distribuem para fora da hélice
A principal força de estabilização da a -
Hélice é a ponte de hidrogênio.
35. -Folhas
Envolve 2 ou mais segmentos
polipeptídicos da mesma molécula ou
de moléculas diferentes, arranjados
em paralelo ou no sentido anti-
paralelo
Os segmentos em folha da proteína
adquirem um aspecto de uma folha
de papel dobrada em pregas.
As pontes de hidrogênio mais uma
vez são a força de estabilização
principal desta estrutura
39. Estrutura Terciária
A estrutura terciária relaciona-se com os
loopings e dobraduras da cadeia protéica
sobre ela mesma.
É a conformação espacial da proteína, como
um todo, e não de determinados segmentos
particulares da cadeia protéica.
A forma das proteínas está relacionada com
sua estrutura terciária.
44. Previsão de Estrutura de Proteínas
Raios X Cerca de 10 a 14 mil estruturas
em repositórios públicos
Experimental
102.000 mil estruturas
RMN primárias
Homologia
Teórico
Ab initio
46. Por que modelar proteínas?
Dificuldade em se obter estruturas experimentais;
Custo elevado
48. Informações Obtidas Através da
Estrutura 3D
Organização estrutural
Estudos sobre o comportamento
dos resíduos
Propriedades eletrostáticas dos
sítios ativos de enzimas
49. Informações Obtidas Através da
Estrutura 3D
Informações funcionais
Estudos sobre a natureza da
ligação
Localização da região de ligação
Seleção de alvos moleculares
para o desenvolvimento de
drogas e vacinas
50. Modelagem por Homologia
A ferramenta mais bem sucedida de predição de estruturas
tridimensionais de proteínas é a modelagem por homologia,
também conhecida como modelagem comparativa.
As proteínas agrupam-se em um número limitado de famílias
tridimensionais. Estima-se que existam cerca de 5.000
famílias protéicas.
Conseqüentemente, quando se conhece a estrutura de pelo
menos um representante de uma família, é geralmente
possível modelar, por homologia, os demais membros da
família.
51. Mioglobina
Em função do número de mutações envolvidas, as
seqüências de aminoácidos de proteínas homólogas podem
ser, idênticas, semelhantes ou dissemelhantes.
52. Modelagem por Homologia
Esta abordagem baseia-se em alguns padrões gerais que têm sido
observados, em nível molecular, no processo de evolução biológica:
Homologia entre seqüências de aminoácidos implica em
semelhança estrutural e funcional;
Proteínas homólogas apresentam regiões internas conservadas
(principalmente constituídas de elementos de estrutura
secundária: -Hélice e -Folhas;
As principais diferenças estruturais entre proteínas homólogas
ocorrem nas regiões externas, constituídas principalmente por
alças ("loops"), que ligam os elementos de estruturas
secundárias.
53. Modelagem por Homologia
A modelagem de uma proteína (proteína-problema)
pelo método da homologia baseia-se no conceito de
evolução molecular.
Isto é, parte-se do princípio de que a semelhança
entre as estruturas primárias desta proteína e de
proteínas homólogas de estruturas tridimensionais
conhecidas (proteínas-molde) implica em similaridade
estrutural entre elas.
54. MODELAGEM MOLECULAR POR
HOMOLOGIA ESTRUTURAL
• Geralmente, o processo de obtenção de um modelo
protéico virtual através da execução da estratégia da
modelagem molecular por homologia estrutural
envolve quatro etapas principais.
55. Identificação dos moldes
Busca por proteínas Homólogas
Alinhamento de sequências
Alinhamento das seqüências Construção da cadeia principal
das regiões conservada
Construção dos modelos
Modelagem das alças
Validação dos Modelos Modelo primitivo
Otimização e validação
não sim
OK? FIM
56. Identificação e seleção de proteínas-
molde
(a) conhece-se a família protéica a que pertence a
proteína-problema;
(b) não se sabe a que família a proteína-problema
pertence.
Se o grau de identidade entre as estruturas primárias
das proteínas-molde e da proteína–problema for igual ou
superior a cerca de
25%, quando o número de resíduos é superior a 80,
existe grande probabilidade de que estas proteínas
tenham estruturas tridimensionais semelhantes.
58. Construção do modelo
Modelagem das regiões estruturalmente
conservadas;
Modelagem das regiões de alças (loop);
Modelagem das cadeias laterais;
Otimização do modelo gerado.
59. Validação do modelo
A qualidade estereoquímica do modelo é de
importância fundamental. O programa mais
utilizado na avaliação dos parâmetros
estereoquímicos, o PROCHECK.
O gráfico de Ramachandran é particularmente útil
porque ele define os resíduos que se encontram
nas regiões energicamente mais favoráveis e
desfavoráveis e orienta a avaliação da qualidade
de modelos teóricos ou experimentais de
proteínas.
61. RMSD
O parâmetro mais comum que expressa a
diferença entre duas estruturas protéicas é o
RMSD, ou desvio médio quadrático, em
posições atômicas entre as duas estruturas.
71. OBRIGADO
www.bioinform
Alpha Helix for Linus Pauling (2004)
Escultura de Julian Voss-Andreae
3 m de altura, revestida de aço.
Portland, EUA
Fonte: http://en.wikipedia.org
72. B. Rost (2001) Protein secondary structure prediction continues to rise. Journal of
Structural Biology, 134, pp. 204-218 (Columbia University).
Bystroff, C., Thorsson, V. & Baker, D. (2000). HMMSTR: a hidden Markov model
for local sequence-structure correlations in proteins. J. Mol. Biol., 301, 173-190
(University of Washington)
Cuff, J. A., Clamp, M. E., Siddiqui, A. S., Finlay, M. & Barton, G. J. (1998). JPred:
a consensus secondary structure prediction server. Bioinformatics, 14, 892-893
(JPred – Oxford/Cambridge)
Cuff, J. A. & Barton, G. J. (2000). Application of multiple sequence alignment
profiles to improve protein secondary structure prediction. Proteins, 40, 502-511
(JPred2)
Rost, B. (1996). PHD: predicting one-dimensional protein structure by profile
based neural networks. Meth. Enzymol., 266, 525-539. (PHD – Heidelberg –
Germany)
73. Referências
DonaldVoet; Judith G. Voet; Charlotte W. Pratt, Funadmentos de
BIOQUÌMICA A vida em nível molecular 2ª ed., 2006.
Lehninger Principles of Biochemistry
Princípios de Bioquímica ( Lehninger ) - 4ª edição - LEHNINGER,
ALBERT L. , COX, NELSON, KAY YARBOROUGH.
Przybylski, D. & Rost, B. (2000). PSI-BLAST for structure prediction: plug-in
and win. Columbia University (PHDPsi)
Rost WWW, B. (2000). Better secondary structure prediction through more
data. Columbia University, WWW document
(http://cubic.bioc.columbia.edu/predictprotein) (PROF)
Altschul, S., Madden, T., Shaffer, A., Zhang, J., Zhang, Z. et al. (1997). Gapped
Blast and PSI-Blast: a new generation of protein database search programs.
Nucl. Acids Res., 25, 3389-3402. (PSI-BLAST – USA)
Jones, D. T. (1999). Protein secondary structure prediction based on position-
specific scoring matrices. J. Mol. Biol., 292, 195-202 (PSIPRED – Warwick)