Genética de doenças complexas e
estudos de associação
do genoma inteiro

Leandro Lima

Doutorando em Bioinformática-USP
Orientadora: Helena Brentani
Co-orientador: Ronaldo Hashimoto
(28/11/2013)
Doenças Mendelianas (ou de
herança Mendeliana)
- Raras
- Causadas por um só gene
- Variações com alta penetrância
Doenças multifatoriais
- São doenças poligênicas e com influência do meio. São
mais comuns que as doenças Mendelianas.
- Como saber a composição genética de uma doença
desse tipo?
Herdabilidade: é a porcentagem da variação fenotípica
causada pela variação genotípica
Ex: altura (dado que a variação em uma população é de
50cm, quanto dessa variação é causado pelo ambiente
e quanto é causado pela variação genética?)
Figura: Bush and Moore (2012)
Exemplo dos planetas
Planeta dos clones
Suponha a existência de um planeta em que todos os
moradores tem o mesmo material genético. A
variação fenotípica (ex: altura ou peso) é
determinada só pela influência do ambiente
Planeta com ambiente totalmente constante
Agora suponha um planeta em que todos os seres
tenham o material genético diferente, mas o ambiente
seja igual em todos os lugares. A variação fenotípica
é determinada somente pela componente genética
(variação genotípica)
Estudos com gêmeos

(irmãos gerados na mesma gestação)
Gêmeos monozigóticos (MZ)
- são gerados a partir do mesmo zigoto
(óvulo+espermatozóide)
- tem o mesmo material genético ao nascerem
Gêmeos dizigóticos (DZ)
- podem ser gerados a partir de mais de um zigoto
- têm cerca de 50% do material genético igual
(mesma porcentagem que dois irmãos nascidos
em gestações diferentes)
Estudos com filhos adotivos
Dada a existência de filhos adotivos com uma
doença...
- há na família original outros casos da doença
(indicando influência genética)?
- e na família adotiva (indicando influência do
ambiente)?
Ou ainda...
- verificar se filhos de pais afetados que foram
adotados por outra família desenvolveram a
doença (indicando influência genotípica) ou não
(indicando influência do ambiente).
Concordância
- Dado que um dos gêmeos tem um
traço/doença, a concordância é a
porcentagem das vezes em que o outro irmão
também terá o traço/doença
Ex: dados 100 pares de gêmeos MZ em que
pelo menos um tinha esquizofrenia, em 60
pares o outro irmão também tinha.
Logo, cmz = 60%.
Cálculo da herdabilidade
h² = (Cmz - Cdz)/(1 – Cdz),

em que h² é a herdabilidade (que mede a
fração da variação em razão dos genes); Cmz é
a taxa de concordância entre co-gêmeos MZ e
Cdz entre co-gêmeos DZ (Otto et al., 2004).
Estudos de ligação
- São estudos que têm o objetivo de encontrar
partes do DNA que são herdadas juntas
- São usados para relacionar regiões (loci) a um
traço ou doença
Estudos de ligação

Figura: http://www.phgfoundation.org/tutorials/variantsDisease/2.html
Ehlers-Danlos disease

Teare and Barrett (2005)
Figura: Bush and Moore (2012)
Figura: Bush and Moore (2012)
Problemas em estudos de ligação

- Muitas doenças não são causadas por um
gene (variação) específico
- Dessa forma, identificar os marcadores fica
bem mais difícil
Estudos de associação
- Relacionam variações a doenças
Resultados positivos de associação podem ser
relacionados a:
1. associação ao acaso (falso positivo)
2. desequilíbrio de ligação (associação indireta)
3. viés amostral (ou estratificação populacional)
4. associação real
Fonte: http://www.phgfoundation.org/tutorials/variantsDisease/4.html
Associação indireta

Figura: Bush and Moore (2012)
Projeto HapMap e 1000 genomas
- Têm o objetivo de encontrar as principais
variações comuns presentes em diferentes
populações (ex: africana, européia e asiática)
- Usando amostras de mais de 1000 pessoas,
foram reportadas cerca de 300.000 a 600.000
SNPs.
Processo do Projeto HapMap

Figura adaptada do site do HapMap (http://hapmap.ncbi.nlm.nih.gov/whatishapmap.html)
Desequilíbrio de ligação

Figura: http://www.molvis.org/molvis/v14/a205/images/mv-v14-1727-f2.jpg
Desequilíbrio de ligação

Figura: Bush and Moore (2012)
Estudos de associação em genoma
inteiro (ou GWAS, genome-wide
association studies)

Figura: Wikipedia (GWAS)
Problemas do GWAS
- Nas plataformas padrão só há variantes
comuns
- Como capturar interações gênicas?
- Arquitetura de doenças complexas é diferente
Possíveis soluções:
> Vias metabólicas
> Levar em conta dados de região promotora,
fatores de transcrição, ilhas de metilação,
(e/m)QTL, microRNA, interação proteínaproteína
Hipótese doença comum/variação comum (DCVC)
- Doenças mais comuns seriam causadas por variações
mais comuns na população
Problema: GWASs têm conseguido explicar somente
uma pequena parte da variação genética
- Possíveis causas:
1. Muitas variantes comuns de pequeno efeito
(solução: usar muito mais amostras)
2. Muitas variantes raras de grande efeito
(solução: incluir variantes raras nas plataformas)
3. Alguma combinação de fatores genotípicos, do meio e
interações epigenéticas
(solução: estudar interações gênicas)
Uso de interações proteína-proteína
Referências
Bush WS, Moore JH (2012) Chapter 11:
Genome-Wide Association Studies. PLoS
Comput Biol 8(12): e1002822.
Otto PG, Otto PA, Frota-Pessoa O. Genética
Humana e Clínica. Editora Roca, 2ª edição,
2004.
Teare MD, Barrett JH (2005). Genetic linkage
studies. Genetic Epidemiology 2. Lancet 2005;
366: 1036–44
Perguntas?

Estudos genéticos em doenças Mendelianas e complexas

  • 1.
    Genética de doençascomplexas e estudos de associação do genoma inteiro Leandro Lima Doutorando em Bioinformática-USP Orientadora: Helena Brentani Co-orientador: Ronaldo Hashimoto (28/11/2013)
  • 2.
    Doenças Mendelianas (oude herança Mendeliana) - Raras - Causadas por um só gene - Variações com alta penetrância
  • 3.
    Doenças multifatoriais - Sãodoenças poligênicas e com influência do meio. São mais comuns que as doenças Mendelianas. - Como saber a composição genética de uma doença desse tipo? Herdabilidade: é a porcentagem da variação fenotípica causada pela variação genotípica Ex: altura (dado que a variação em uma população é de 50cm, quanto dessa variação é causado pelo ambiente e quanto é causado pela variação genética?)
  • 4.
    Figura: Bush andMoore (2012)
  • 5.
    Exemplo dos planetas Planetados clones Suponha a existência de um planeta em que todos os moradores tem o mesmo material genético. A variação fenotípica (ex: altura ou peso) é determinada só pela influência do ambiente Planeta com ambiente totalmente constante Agora suponha um planeta em que todos os seres tenham o material genético diferente, mas o ambiente seja igual em todos os lugares. A variação fenotípica é determinada somente pela componente genética (variação genotípica)
  • 6.
    Estudos com gêmeos (irmãosgerados na mesma gestação) Gêmeos monozigóticos (MZ) - são gerados a partir do mesmo zigoto (óvulo+espermatozóide) - tem o mesmo material genético ao nascerem Gêmeos dizigóticos (DZ) - podem ser gerados a partir de mais de um zigoto - têm cerca de 50% do material genético igual (mesma porcentagem que dois irmãos nascidos em gestações diferentes)
  • 7.
    Estudos com filhosadotivos Dada a existência de filhos adotivos com uma doença... - há na família original outros casos da doença (indicando influência genética)? - e na família adotiva (indicando influência do ambiente)? Ou ainda... - verificar se filhos de pais afetados que foram adotados por outra família desenvolveram a doença (indicando influência genotípica) ou não (indicando influência do ambiente).
  • 8.
    Concordância - Dado queum dos gêmeos tem um traço/doença, a concordância é a porcentagem das vezes em que o outro irmão também terá o traço/doença Ex: dados 100 pares de gêmeos MZ em que pelo menos um tinha esquizofrenia, em 60 pares o outro irmão também tinha. Logo, cmz = 60%.
  • 9.
    Cálculo da herdabilidade h²= (Cmz - Cdz)/(1 – Cdz), em que h² é a herdabilidade (que mede a fração da variação em razão dos genes); Cmz é a taxa de concordância entre co-gêmeos MZ e Cdz entre co-gêmeos DZ (Otto et al., 2004).
  • 10.
    Estudos de ligação -São estudos que têm o objetivo de encontrar partes do DNA que são herdadas juntas - São usados para relacionar regiões (loci) a um traço ou doença
  • 11.
    Estudos de ligação Figura:http://www.phgfoundation.org/tutorials/variantsDisease/2.html
  • 12.
  • 13.
    Figura: Bush andMoore (2012)
  • 14.
    Figura: Bush andMoore (2012)
  • 15.
    Problemas em estudosde ligação - Muitas doenças não são causadas por um gene (variação) específico - Dessa forma, identificar os marcadores fica bem mais difícil
  • 16.
    Estudos de associação -Relacionam variações a doenças Resultados positivos de associação podem ser relacionados a: 1. associação ao acaso (falso positivo) 2. desequilíbrio de ligação (associação indireta) 3. viés amostral (ou estratificação populacional) 4. associação real Fonte: http://www.phgfoundation.org/tutorials/variantsDisease/4.html
  • 17.
  • 18.
    Projeto HapMap e1000 genomas - Têm o objetivo de encontrar as principais variações comuns presentes em diferentes populações (ex: africana, européia e asiática) - Usando amostras de mais de 1000 pessoas, foram reportadas cerca de 300.000 a 600.000 SNPs.
  • 19.
    Processo do ProjetoHapMap Figura adaptada do site do HapMap (http://hapmap.ncbi.nlm.nih.gov/whatishapmap.html)
  • 20.
    Desequilíbrio de ligação Figura:http://www.molvis.org/molvis/v14/a205/images/mv-v14-1727-f2.jpg
  • 21.
  • 22.
    Estudos de associaçãoem genoma inteiro (ou GWAS, genome-wide association studies) Figura: Wikipedia (GWAS)
  • 23.
    Problemas do GWAS -Nas plataformas padrão só há variantes comuns - Como capturar interações gênicas? - Arquitetura de doenças complexas é diferente Possíveis soluções: > Vias metabólicas > Levar em conta dados de região promotora, fatores de transcrição, ilhas de metilação, (e/m)QTL, microRNA, interação proteínaproteína
  • 24.
    Hipótese doença comum/variaçãocomum (DCVC) - Doenças mais comuns seriam causadas por variações mais comuns na população Problema: GWASs têm conseguido explicar somente uma pequena parte da variação genética - Possíveis causas: 1. Muitas variantes comuns de pequeno efeito (solução: usar muito mais amostras) 2. Muitas variantes raras de grande efeito (solução: incluir variantes raras nas plataformas) 3. Alguma combinação de fatores genotípicos, do meio e interações epigenéticas (solução: estudar interações gênicas)
  • 25.
    Uso de interaçõesproteína-proteína
  • 26.
    Referências Bush WS, MooreJH (2012) Chapter 11: Genome-Wide Association Studies. PLoS Comput Biol 8(12): e1002822. Otto PG, Otto PA, Frota-Pessoa O. Genética Humana e Clínica. Editora Roca, 2ª edição, 2004. Teare MD, Barrett JH (2005). Genetic linkage studies. Genetic Epidemiology 2. Lancet 2005; 366: 1036–44
  • 27.