1. Introduction Mod`les D´mographiques
e e Un exemple d’application D´veloppements
e Conclusion
Mod`les hi´rarchiques bay´siens de diff´renciation
e e e e
g´n´tique et recherche de signatures de s´lection
e e e
applications ` des jeux de donn´es SNP haut-d´bit
a e e
Mathieu Gautier
UMR INRA/CIRAD/IRD/SupAgro CBGP
29 Juin 2011
2. Introduction Mod`les D´mographiques
e e Un exemple d’application D´veloppements
e Conclusion
Recherche de signatures de s´lection
e
Forces ´volutives gouvernant l’´volution des fr´quences
e e e
all´liques
e
ˆ Mutation (et recombinaison ` l’´chelle haplotypique)
a e : source de la variabilit´
e
ˆ D´rive g´n´tique : introduit la stochasticit´ (Taille finie des populations)
e e e e
ˆ Migration en terme de flux de g`nes
e
ˆ S´lection
e
Influence diff´rente ` l’´chelle du g´nome
e a e e (Cavalli-Sforza, 1966)
ˆ Facteurs d´mographiques (d´rive, flux de g`ne) ⇒ effet global
e e e
ˆ Selection (mutation et recombinaison) ⇒ effet local
3. Introduction Mod`les D´mographiques
e e Un exemple d’application D´veloppements
e Conclusion
Diff´rentes approches
e
Principe G´n´ral
e e
ˆ D´finition d’un estimateur de la variabilit´ g´n´tique intra/inter
e e e e
population (e.g. FST , EHH)
ˆ Recherche d’outliers (relativement ` l’attendu neutre)
a
ˆ Distribution th´orique (Lewontin et Krakauer, 1973, Bonhomme et al., 2010)
e
ˆ Distribution simul´e (Bowcock et al., 1991, Beaumont & Nichols, 1996)
e
ˆ Distribution empirique (Akey et al., 2002)
Mod`lisation Hi´rarchique (Bay´sienne)
e e e
ˆ Efficace pour distinguer les effets locus des effets population-sp´cifique
e
sur la variabilit´ g´n´tique
e e e
ˆ La distribution (fr´quences all´liques)
e e est connue (ou approchable) pour diff´rents
e
mod`les
e (d´mographiques)
e
4. Introduction Mod`les D´mographiques
e e Un exemple d’application D´veloppements
e Conclusion
FST et pure-d´rive
e
Mod`le (d´mographique) de Wright/Fisher
e e
ˆ Les populations ont ´volu´ pendant t g´n´rations
e e e e (non chevauchantes) en
complet isolement depuis une population ancestrale commune
ˆ Illustration dans le cas de taille de population constante (N)
Evolution des fr´quences all´liques
e e
ˆ P(Xt+1 = j|Xt = i) = j
2N
ψij (1 − ψi )2N−j
o` ψi =
u i ,E[Xt+1 |Xt = xt ] = xt et V[Xt+1 |Xt = xt ] = 2Nxt (1 − xt )
2N
ˆ E[Xt ] ≡ E[E[Xt |Xt−1 ]] = E[Xt−1 ] = ... = x0 = 2Np0 ⇒ E[pt = Xt
2N
] = p0
ˆ V[pt ] = p0 (1 − p0 )[1 − (1 − 1/2N)t ]
5. Introduction Mod`les D´mographiques
e e Un exemple d’application D´veloppements
e Conclusion
FST et pure-d´rive
e
Mod`le en d´s´quilibre
e ee (e.g. temps de fixation)
ˆ t(p0 ) = − 4Ne (1−pp0
0 )ln(1−p0 )
(Kimura et Ohta, 1971)
ˆ Si p 1 (e.g. p0 = 2Ne ) ⇒ t(p0 )
1 4Ne
(pfix1 = p0 , pfix2 = 1 − p0 )
Evolution de la diff´rentiation
e
ˆ La variabilit´ des fr´quences all´liques inter-pop
e e e
(diff´rentiation)
e augmente au cours du temps
(Vmax = p0 (1 − p0 ))
ˆ D´finition : FST =
e
V (p)
p0 (1−p0 )
= 1 − (1 − 2N )t
1 t
2N
⇔ Mesure de l’avancement du processus de
d´rive (aboutissant ` la fixation d’un all`le)
e a e
6. Introduction Mod`les D´mographiques
e e Un exemple d’application D´veloppements
e Conclusion
Simulations : 8 pops (2Ne = 500), 10000 SNPs (8500 neu, 250 per s class)
t = 50 generations
t = 100 generations
9. Introduction Mod`les D´mographiques
e e Un exemple d’application D´veloppements
e Conclusion
Identification de locus outliers : PPP-value (Gautier et al., 2010)
Ecart au mod`le
e (H0 : ´changeabilit´ des loci)
e e
J
[yij −E(yij |πi ,cj )]2
ˆ Mesure de discr´pance : T (yij , πi , cj ) =
e V(yij |πi ,cj )
j=1
πi (1−πi )(1+(nij −1)cj )
avec E(yij | πi , cj ) = πi et V(yij | πi , cj ) = nij
ˆ Pi = P T (yij , πi , cj ) T (yij , πi , cj ) | yij
r
Impl´mentation (MCMC)
e
ˆ A chaque it´ration t, on ´chantillonne yij ∼ Bin(nij , αij )
e e r t
J
Tt (yij , πit , cjt ) − Tt (yij , πit , cjt ) 0
r
ˆ On calcule :
1 si
Pt =
i j=1
0 sinon
N
ˆ Pi = 1
N
Pt
i
t=1