SlideShare uma empresa Scribd logo
1 de 63
Baixar para ler offline
Open problems in
                          association mapping
                                                  Thomas Mailund




&

!"
                         Bioinformatics
!!"#$%&$'()*"%(+,&&&&&&&&&&&&&&&&&&&&&&& Centre
                         Research
Stuff about
                           Open problems in
                          association mapping
                                                  Thomas Mailund




&

!"
                         Bioinformatics
!!"#$%&$'()*"%(+,&&&&&&&&&&&&&&&&&&&&&&& Centre
                         Research
Overview

• Tutorial
• Multi-marker methods - rare(er) variants
• Multi-loci methods - epistasis
Tutorial
Gunshot wounds
Car accidents
Smoking induced
lung cancer       “Genetic” diseases
Cardiovascular
disease
Obesity
Diabetes 2
Alzheimer
Schizophrenia
BRCA1
breast cancer
Cystic fibrosis
Haemophilia
Disease mapping...
Locate disease-affecting polymorphisms

   Cases (affected)
                        --A--------C--------A----G---X----T---C---A----
                        --T--------G--------A----G---X----C---C---A----
                        --A--------G--------G----G---X----C---C---A----
                        --A--------C--------A----G---X----T---C---A----
                        --T--------C--------A----G---X----T---C---A----
                        --T--------C--------A----T---X----T---A---A----

                        --A--------C--------A----G---X----T---C---A----
                        --A--------C--------A----G---X----T---C---A----
                        --A--------C--------A----G---X----T---C---G----
                        --T--------C--------A----T---X----T---C---A----
                        --A--------C--------A----G---X----T---C---A----
                        --A--------C--------G----T---X----C---A---A----
                        --A--------C--------A----G---X----C---C---G----

Controls (unaffected)
Disease mapping...
Locate phenotype-affecting polymorphisms


                   --A--------C--------A----G---X----T---C---A----
                   --T--------G--------A----G---X----C---C---A----
                   --A--------G--------G----G---X----C---C---A----
                   --A--------C--------A----G---X----T---C---A----
                   --T--------C--------A----G---X----T---C---A----
                   --T--------C--------A----T---X----T---A---A----

                   --A--------C--------A----G---X----T---C---A----
                   --A--------C--------A----G---X----T---C---A----
                   --A--------C--------A----G---X----T---C---G----
                   --T--------C--------A----T---X----T---C---A----
                   --A--------C--------A----G---X----T---C---A----
                   --A--------C--------G----T---X----C---A---A----
                   --A--------C--------A----G---X----C---C---G----
Disease mapping...
Markers are locally correlated

   Cases (affected)
                        --A--------C--------A----G---X----T---C---A----
                        --T--------G--------A----G---X----C---C---A----
                        --A--------G--------G----G---X----C---C---A----
                        --A--------C--------A----G---X----T---C---A----
                        --T--------C--------A----G---X----T---C---A----
                        --T--------C--------A----T---X----T---A---A----

                        --A--------C--------A----G---X----T---C---A----
                        --A--------C--------A----G---X----T---C---A----
                        --A--------C--------A----G---X----T---C---G----
                        --T--------C--------A----T---X----T---C---A----
                        --A--------C--------A----G---X----T---C---A----
                        --A--------C--------G----T---X----C---A---A----
                        --A--------C--------A----G---X----C---C---G----

Controls (unaffected)
Marker Relatedness
                  Linkage disequilibrium (LD)

 Empirical Results                              Theoretical Results




                                      LD (r2)




                                                     Recombination rate

Clark et al. 2003, AJHG 73:285-300.                  Hein et al. 2005
Disease mapping...
Search for indirect signals

   Cases (affected)
                        --A--------C--------A----G---X----T---C---A----
                        --T--------G--------A----G---X----C---C---A----
                        --A--------G--------G----G---X----C---C---A----
                        --A--------C--------A----G---X----T---C---A----
                        --T--------C--------A----G---X----T---C---A----
                        --T--------C--------A----T---X----T---A---A----

                        --A--------C--------A----G---X----T---C---A----
                        --A--------C--------A----G---X----T---C---A----
                        --A--------C--------A----G---X----T---C---G----
                        --T--------C--------A----T---X----T---C---A----
                        --A--------C--------A----G---X----T---C---A----
                        --A--------C--------G----T---X----C---A---A----
                        --A--------C--------A----G---X----C---C---G----

Controls (unaffected)
Indirect Association
               “Tag” markers                    Unobserved marker

   Cases (affected)
                        --A--------C--------A----G---X----T---C---A----
                        --T--------G--------A----G---X----C---C---A----
                        --A--------G--------G----G---X----C---C---A----
                        --A--------C--------A----G---X----T---C---A----
                        --T--------C--------A----G---X----T---C---A----
                        --T--------C--------A----T---X----T---A---A----

                        --A--------C--------A----G---X----T---C---A----
                        --A--------C--------A----G---X----T---C---A----
                        --A--------C--------A----G---X----T---C---G----
                        --T--------C--------A----T---X----T---C---A----
                        --A--------C--------A----G---X----T---C---A----
                        --A--------C--------G----T---X----C---A---A----
                        --A--------C--------A----G---X----C---C---G----

Controls (unaffected)
Indirect Association


   Cases (affected)
                        --A--------C--------A----G---X----T---C---A----
                        --T--------G--------A----G---X----C---C---A----
                        --A--------G--------G----G---X----C---C---A----
                        --A--------C--------A----G---X----T---C---A----
                        --T--------C--------A----G---X----T---C---A----
                        --T--------C--------A----T---X----T---A---A----

                        --A--------C--------A----G---X----T---C---A----
                        --A--------C--------A----G---X----T---C---A----
                        --A--------C--------A----G---X----T---C---G----
                        --T--------C--------A----T---X----T---C---A----
                        --A--------C--------A----G---X----T---C---A----
                        --A--------C--------G----T---X----C---A---A----
                        --A--------C--------A----G---X----C---C---G----

Controls (unaffected)
Indirect Association


   Cases (affected)
                        --A--------C--------A----G---X----T---C---A----
                        --T--------G--------A----G---X----C---C---A----
                        --A--------G--------G----G---X----C---C---A----
                        --A--------C--------A----G---X----T---C---A----
                        --T--------C--------A----G---X----T---C---A----
                        --T--------C--------A----T---X----T---A---A----

                        --A--------C--------A----G---X----T---C---A----
                        --A--------C--------A----G---X----T---C---A----
                        --A--------C--------A----G---X----T---C---G----
                        --T--------C--------A----T---X----T---C---A----
                        --A--------C--------A----G---X----T---C---A----
                        --A--------C--------G----T---X----C---A---A----
                        --A--------C--------A----G---X----C---C---G----

Controls (unaffected)
Indirect Association


   Cases (affected)
                        --A--------C--------A----G---X----T---C---A----
                        --T--------G--------A----G---X----C---C---A----
                        --A--------G--------G----G---X----C---C---A----
                        --A--------C--------A----G---X----T---C---A----
                        --T--------C--------A----G---X----T---C---A----
                        --T--------C--------A----T---X----T---A---A----

                        --A--------C--------A----G---X----T---C---A----
                        --A--------C--------A----G---X----T---C---A----
                        --A--------C--------A----G---X----T---C---G----
                        --T--------C--------A----T---X----T---C---A----
                        --A--------C--------A----G---X----T---C---A----
                        --A--------C--------G----T---X----C---A---A----
                        --A--------C--------A----G---X----C---C---G----

Controls (unaffected)
Indirect Association


   Cases (affected)
                        --A--------C--------A----G---X----T---C---A----
                        --T--------G--------A----G---X----C---C---A----
                        --A--------G--------G----G---X----C---C---A----
                        --A--------C--------A----G---X----T---C---A----
                        --T--------C--------A----G---X----T---C---A----
                        --T--------C--------A----T---X----T---A---A----

                        --A--------C--------A----G---X----T---C---A----
                        --A--------C--------A----G---X----T---C---A----
                        --A--------C--------A----G---X----T---C---G----
                        --T--------C--------A----T---X----T---C---A----
                        --A--------C--------A----G---X----T---C---A----
                        --A--------C--------G----T---X----C---A---A----
                        --A--------C--------A----G---X----C---C---G----

Controls (unaffected)
GWA


Type 500k - 1m and get 3b
GWA


Type 500k - 1m and get 3b
                The common
                  variants
Multiple test issues


5% significance threshold
means 5% false positives...
Null distribution
Alternative distribution
Null distribution
Alternative distribution
Null distribution
Alternative distribution
Null distribution
"Real" null distribution
Alternative distribution
WTCCC results
GWA a successful
  approach

~500 validated findings
for ~100 different traits
GWA a successful
  approach

~500 validated findings
for ~100 different traits
...but much genetic risk
remains unexplained!
Why?
Why?

• Rare variants?
 • We only tag common variants...
• Gene-gene interaction?
 • Marginal effects vs interactions...
Multi-marker methods
Indirect Association


   Cases (affected)
                        --A--------C--------A----G---X----T---C---A----
                        --T--------G--------A----G---X----C---C---A----
                        --A--------G--------G----G---X----C---C---A----
                        --A--------C--------A----G---X----T---C---A----
                        --T--------C--------A----G---X----T---C---A----
                        --T--------C--------A----T---X----T---A---A----

                        --A--------C--------A----G---X----T---C---A----
                        --A--------C--------A----G---X----T---C---A----
                        --A--------C--------A----G---X----T---C---G----
                        --T--------C--------A----T---X----T---C---A----
                        --A--------C--------A----G---X----T---C---A----
                        --A--------C--------G----T---X----C---A---A----
                        --A--------C--------A----G---X----C---C---G----

Controls (unaffected)
Indirect Association


   Cases (affected)
                        --A--------C--------A----G---X----T---C---A----
                        --T--------G--------A----G---X----C---C---A----
                        --A--------G--------G----G---X----C---C---A----
                        --A--------C--------A----G---X----T---C---A----
                        --T--------C--------A----G---X----T---C---A----
                        --T--------C--------A----T---X----T---A---A----

                        --A--------C--------A----G---X----T---C---A----
                        --A--------C--------A----G---X----T---C---A----
                        --A--------C--------A----G---X----T---C---G----
                        --T--------C--------A----T---X----T---C---A----
                        --A--------C--------A----G---X----T---C---A----
                        --A--------C--------G----T---X----C---A---A----
                        --A--------C--------A----G---X----C---C---G----

Controls (unaffected)
Indirect Association


   Cases (affected)
                        --A--------C--------A----G---X----T---C---A----
                        --T--------G--------A----G---X----C---C---A----
                        --A--------G--------G----G---X----C---C---A----
                        --A--------C--------A----G---X----T---C---A----
                        --T--------C--------A----G---X----T---C---A----
                        --T--------C--------A----T---X----T---A---A----

                        --A--------C--------A----G---X----T---C---A----
                        --A--------C--------A----G---X----T---C---A----
                        --A--------C--------A----G---X----T---C---G----
                        --T--------C--------A----T---X----T---C---A----
                        --A--------C--------A----G---X----T---C---A----
                        --A--------C--------G----T---X----C---A---A----
                        --A--------C--------A----G---X----C---C---G----

Controls (unaffected)
Indirect Association


   Cases (affected)
                        --A--------C--------A----G---X----T---C---A----
                        --T--------G--------A----G---X----C---C---A----
                        --A--------G--------G----G---X----C---C---A----
                        --A--------C--------A----G---X----T---C---A----
                        --T--------C--------A----G---X----T---C---A----
                        --T--------C--------A----T---X----T---A---A----

                        --A--------C--------A----G---X----T---C---A----
                        --A--------C--------A----G---X----T---C---A----
                        --A--------C--------A----G---X----T---C---G----
                        --T--------C--------A----T---X----T---C---A----
                        --A--------C--------A----G---X----T---C---A----
                        --A--------C--------G----T---X----C---A---A----
                        --A--------C--------A----G---X----C---C---G----

Controls (unaffected)
Indirect
          Multi-Marker
           Association
   Cases (affected)
                        --A--------C--------A----G---X----T---C---A----
                        --T--------G--------A----G---X----C---C---A----
                        --A--------G--------G----G---X----C---C---A----
                        --A--------C--------A----G---X----T---C---A----
                        --T--------C--------A----G---X----T---C---A----
                        --T--------C--------A----T---X----T---A---A----

                        --A--------C--------A----G---X----T---C---A----
                        --A--------C--------A----G---X----T---C---A----
                        --A--------C--------A----G---X----T---C---G----
                        --T--------C--------A----T---X----T---C---A----
                        --A--------C--------A----G---X----T---C---A----
                        --A--------C--------G----T---X----C---A---A----
                        --A--------C--------A----G---X----C---C---G----

Controls (unaffected)
Local trees along the
       genome
Local trees along the
       genome
Local trees along the
       genome
Local trees along the
       genome
Trees and LD
Tree similarity




                                       LD r2




                  Recombination rate           Recombination rate
Clustering on a tree
           Disease affecting mutation
Clustering on a tree
  Complete penetrance


          Incomplete penetrance



  Spurious disease
Clustering on a tree

  25%
              Case/control clustering
              is not random on the tree...
        75%




                             40%
                    60%
Scoring the clustering

                   Red=cases
                   Green=controls



Are the case chromosomes significantly
over-represented in some clusters?
Besenbacher et al. 2009
Multi-loci methods
A
A
A
G
G
          A       3       2



A
A         G       3       2
A
G
G
     3

    1.5

     0
              A       G
T
T
A
A
A
          T       2       3



A
A         A       2       3
A
T
T
     3

    1.5

     0
              T       A
A   T
A   T
A   A       AT        2        0
G   A
G   A
            AA        1        1

            GA        2        0
A   A
A   A
A   A       GT        0        2
G   T
G   T
        2

        1

        0
            AT   AA       GA   GT
Explosion in complexity


   500k markers gives us
     ~125 billion pairs!
Explosion in complexity


   500k markers gives us
     ~2·10 16 triplets
• Using protein interaction networks we
 • Reduced ~125 billion tests to ~3-4 million
 • Reduced corrected significance threshold
                                -8
    from   ~4·10-13   to   ~9·10
Perspectives...
• Complete genome sequencing
 • No need for tagging
 • Rare variants
 • Structural variation
• Pathway analysis
 • Analysis of pathways as a whole
 • Constructing tests from known pathways
Ku 05 08 2009

Mais conteúdo relacionado

Mais de mailund

Chapter 9 divide and conquer handouts with notes
Chapter 9   divide and conquer handouts with notesChapter 9   divide and conquer handouts with notes
Chapter 9 divide and conquer handouts with notesmailund
 
Chapter 9 divide and conquer handouts
Chapter 9   divide and conquer handoutsChapter 9   divide and conquer handouts
Chapter 9 divide and conquer handoutsmailund
 
Chapter 9 divide and conquer
Chapter 9   divide and conquerChapter 9   divide and conquer
Chapter 9 divide and conquermailund
 
Chapter 7 recursion handouts with notes
Chapter 7   recursion handouts with notesChapter 7   recursion handouts with notes
Chapter 7 recursion handouts with notesmailund
 
Chapter 7 recursion handouts
Chapter 7   recursion handoutsChapter 7   recursion handouts
Chapter 7 recursion handoutsmailund
 
Chapter 7 recursion
Chapter 7   recursionChapter 7   recursion
Chapter 7 recursionmailund
 
Chapter 5 searching and sorting handouts with notes
Chapter 5   searching and sorting handouts with notesChapter 5   searching and sorting handouts with notes
Chapter 5 searching and sorting handouts with notesmailund
 
Chapter 5 searching and sorting handouts
Chapter 5   searching and sorting handoutsChapter 5   searching and sorting handouts
Chapter 5 searching and sorting handoutsmailund
 
Chapter 5 searching and sorting
Chapter 5   searching and sortingChapter 5   searching and sorting
Chapter 5 searching and sortingmailund
 
Chapter 4 algorithmic efficiency handouts (with notes)
Chapter 4   algorithmic efficiency handouts (with notes)Chapter 4   algorithmic efficiency handouts (with notes)
Chapter 4 algorithmic efficiency handouts (with notes)mailund
 
Chapter 4 algorithmic efficiency handouts
Chapter 4   algorithmic efficiency handoutsChapter 4   algorithmic efficiency handouts
Chapter 4 algorithmic efficiency handoutsmailund
 
Chapter 4 algorithmic efficiency
Chapter 4   algorithmic efficiencyChapter 4   algorithmic efficiency
Chapter 4 algorithmic efficiencymailund
 
Chapter 3 introduction to algorithms slides
Chapter 3 introduction to algorithms slidesChapter 3 introduction to algorithms slides
Chapter 3 introduction to algorithms slidesmailund
 
Chapter 3 introduction to algorithms handouts (with notes)
Chapter 3 introduction to algorithms handouts (with notes)Chapter 3 introduction to algorithms handouts (with notes)
Chapter 3 introduction to algorithms handouts (with notes)mailund
 
Chapter 3 introduction to algorithms handouts
Chapter 3 introduction to algorithms handoutsChapter 3 introduction to algorithms handouts
Chapter 3 introduction to algorithms handoutsmailund
 
Course Introduction
Course IntroductionCourse Introduction
Course Introductionmailund
 
Linear Classification
Linear ClassificationLinear Classification
Linear Classificationmailund
 
Linear Regression
Linear RegressionLinear Regression
Linear Regressionmailund
 
Presentation at APBC 2007
Presentation at APBC 2007Presentation at APBC 2007
Presentation at APBC 2007mailund
 
Epidemiologisk FredagsmøDe 15 2 2008
Epidemiologisk FredagsmøDe 15 2 2008Epidemiologisk FredagsmøDe 15 2 2008
Epidemiologisk FredagsmøDe 15 2 2008mailund
 

Mais de mailund (20)

Chapter 9 divide and conquer handouts with notes
Chapter 9   divide and conquer handouts with notesChapter 9   divide and conquer handouts with notes
Chapter 9 divide and conquer handouts with notes
 
Chapter 9 divide and conquer handouts
Chapter 9   divide and conquer handoutsChapter 9   divide and conquer handouts
Chapter 9 divide and conquer handouts
 
Chapter 9 divide and conquer
Chapter 9   divide and conquerChapter 9   divide and conquer
Chapter 9 divide and conquer
 
Chapter 7 recursion handouts with notes
Chapter 7   recursion handouts with notesChapter 7   recursion handouts with notes
Chapter 7 recursion handouts with notes
 
Chapter 7 recursion handouts
Chapter 7   recursion handoutsChapter 7   recursion handouts
Chapter 7 recursion handouts
 
Chapter 7 recursion
Chapter 7   recursionChapter 7   recursion
Chapter 7 recursion
 
Chapter 5 searching and sorting handouts with notes
Chapter 5   searching and sorting handouts with notesChapter 5   searching and sorting handouts with notes
Chapter 5 searching and sorting handouts with notes
 
Chapter 5 searching and sorting handouts
Chapter 5   searching and sorting handoutsChapter 5   searching and sorting handouts
Chapter 5 searching and sorting handouts
 
Chapter 5 searching and sorting
Chapter 5   searching and sortingChapter 5   searching and sorting
Chapter 5 searching and sorting
 
Chapter 4 algorithmic efficiency handouts (with notes)
Chapter 4   algorithmic efficiency handouts (with notes)Chapter 4   algorithmic efficiency handouts (with notes)
Chapter 4 algorithmic efficiency handouts (with notes)
 
Chapter 4 algorithmic efficiency handouts
Chapter 4   algorithmic efficiency handoutsChapter 4   algorithmic efficiency handouts
Chapter 4 algorithmic efficiency handouts
 
Chapter 4 algorithmic efficiency
Chapter 4   algorithmic efficiencyChapter 4   algorithmic efficiency
Chapter 4 algorithmic efficiency
 
Chapter 3 introduction to algorithms slides
Chapter 3 introduction to algorithms slidesChapter 3 introduction to algorithms slides
Chapter 3 introduction to algorithms slides
 
Chapter 3 introduction to algorithms handouts (with notes)
Chapter 3 introduction to algorithms handouts (with notes)Chapter 3 introduction to algorithms handouts (with notes)
Chapter 3 introduction to algorithms handouts (with notes)
 
Chapter 3 introduction to algorithms handouts
Chapter 3 introduction to algorithms handoutsChapter 3 introduction to algorithms handouts
Chapter 3 introduction to algorithms handouts
 
Course Introduction
Course IntroductionCourse Introduction
Course Introduction
 
Linear Classification
Linear ClassificationLinear Classification
Linear Classification
 
Linear Regression
Linear RegressionLinear Regression
Linear Regression
 
Presentation at APBC 2007
Presentation at APBC 2007Presentation at APBC 2007
Presentation at APBC 2007
 
Epidemiologisk FredagsmøDe 15 2 2008
Epidemiologisk FredagsmøDe 15 2 2008Epidemiologisk FredagsmøDe 15 2 2008
Epidemiologisk FredagsmøDe 15 2 2008
 

Ku 05 08 2009

  • 1. Open problems in association mapping Thomas Mailund & !" Bioinformatics !!"#$%&$'()*"%(+,&&&&&&&&&&&&&&&&&&&&&&& Centre Research
  • 2. Stuff about Open problems in association mapping Thomas Mailund & !" Bioinformatics !!"#$%&$'()*"%(+,&&&&&&&&&&&&&&&&&&&&&&& Centre Research
  • 3. Overview • Tutorial • Multi-marker methods - rare(er) variants • Multi-loci methods - epistasis
  • 5. Gunshot wounds Car accidents Smoking induced lung cancer “Genetic” diseases Cardiovascular disease Obesity Diabetes 2 Alzheimer Schizophrenia BRCA1 breast cancer Cystic fibrosis Haemophilia
  • 6. Disease mapping... Locate disease-affecting polymorphisms Cases (affected) --A--------C--------A----G---X----T---C---A---- --T--------G--------A----G---X----C---C---A---- --A--------G--------G----G---X----C---C---A---- --A--------C--------A----G---X----T---C---A---- --T--------C--------A----G---X----T---C---A---- --T--------C--------A----T---X----T---A---A---- --A--------C--------A----G---X----T---C---A---- --A--------C--------A----G---X----T---C---A---- --A--------C--------A----G---X----T---C---G---- --T--------C--------A----T---X----T---C---A---- --A--------C--------A----G---X----T---C---A---- --A--------C--------G----T---X----C---A---A---- --A--------C--------A----G---X----C---C---G---- Controls (unaffected)
  • 7. Disease mapping... Locate phenotype-affecting polymorphisms --A--------C--------A----G---X----T---C---A---- --T--------G--------A----G---X----C---C---A---- --A--------G--------G----G---X----C---C---A---- --A--------C--------A----G---X----T---C---A---- --T--------C--------A----G---X----T---C---A---- --T--------C--------A----T---X----T---A---A---- --A--------C--------A----G---X----T---C---A---- --A--------C--------A----G---X----T---C---A---- --A--------C--------A----G---X----T---C---G---- --T--------C--------A----T---X----T---C---A---- --A--------C--------A----G---X----T---C---A---- --A--------C--------G----T---X----C---A---A---- --A--------C--------A----G---X----C---C---G----
  • 8. Disease mapping... Markers are locally correlated Cases (affected) --A--------C--------A----G---X----T---C---A---- --T--------G--------A----G---X----C---C---A---- --A--------G--------G----G---X----C---C---A---- --A--------C--------A----G---X----T---C---A---- --T--------C--------A----G---X----T---C---A---- --T--------C--------A----T---X----T---A---A---- --A--------C--------A----G---X----T---C---A---- --A--------C--------A----G---X----T---C---A---- --A--------C--------A----G---X----T---C---G---- --T--------C--------A----T---X----T---C---A---- --A--------C--------A----G---X----T---C---A---- --A--------C--------G----T---X----C---A---A---- --A--------C--------A----G---X----C---C---G---- Controls (unaffected)
  • 9. Marker Relatedness Linkage disequilibrium (LD) Empirical Results Theoretical Results LD (r2) Recombination rate Clark et al. 2003, AJHG 73:285-300. Hein et al. 2005
  • 10. Disease mapping... Search for indirect signals Cases (affected) --A--------C--------A----G---X----T---C---A---- --T--------G--------A----G---X----C---C---A---- --A--------G--------G----G---X----C---C---A---- --A--------C--------A----G---X----T---C---A---- --T--------C--------A----G---X----T---C---A---- --T--------C--------A----T---X----T---A---A---- --A--------C--------A----G---X----T---C---A---- --A--------C--------A----G---X----T---C---A---- --A--------C--------A----G---X----T---C---G---- --T--------C--------A----T---X----T---C---A---- --A--------C--------A----G---X----T---C---A---- --A--------C--------G----T---X----C---A---A---- --A--------C--------A----G---X----C---C---G---- Controls (unaffected)
  • 11. Indirect Association “Tag” markers Unobserved marker Cases (affected) --A--------C--------A----G---X----T---C---A---- --T--------G--------A----G---X----C---C---A---- --A--------G--------G----G---X----C---C---A---- --A--------C--------A----G---X----T---C---A---- --T--------C--------A----G---X----T---C---A---- --T--------C--------A----T---X----T---A---A---- --A--------C--------A----G---X----T---C---A---- --A--------C--------A----G---X----T---C---A---- --A--------C--------A----G---X----T---C---G---- --T--------C--------A----T---X----T---C---A---- --A--------C--------A----G---X----T---C---A---- --A--------C--------G----T---X----C---A---A---- --A--------C--------A----G---X----C---C---G---- Controls (unaffected)
  • 12. Indirect Association Cases (affected) --A--------C--------A----G---X----T---C---A---- --T--------G--------A----G---X----C---C---A---- --A--------G--------G----G---X----C---C---A---- --A--------C--------A----G---X----T---C---A---- --T--------C--------A----G---X----T---C---A---- --T--------C--------A----T---X----T---A---A---- --A--------C--------A----G---X----T---C---A---- --A--------C--------A----G---X----T---C---A---- --A--------C--------A----G---X----T---C---G---- --T--------C--------A----T---X----T---C---A---- --A--------C--------A----G---X----T---C---A---- --A--------C--------G----T---X----C---A---A---- --A--------C--------A----G---X----C---C---G---- Controls (unaffected)
  • 13. Indirect Association Cases (affected) --A--------C--------A----G---X----T---C---A---- --T--------G--------A----G---X----C---C---A---- --A--------G--------G----G---X----C---C---A---- --A--------C--------A----G---X----T---C---A---- --T--------C--------A----G---X----T---C---A---- --T--------C--------A----T---X----T---A---A---- --A--------C--------A----G---X----T---C---A---- --A--------C--------A----G---X----T---C---A---- --A--------C--------A----G---X----T---C---G---- --T--------C--------A----T---X----T---C---A---- --A--------C--------A----G---X----T---C---A---- --A--------C--------G----T---X----C---A---A---- --A--------C--------A----G---X----C---C---G---- Controls (unaffected)
  • 14. Indirect Association Cases (affected) --A--------C--------A----G---X----T---C---A---- --T--------G--------A----G---X----C---C---A---- --A--------G--------G----G---X----C---C---A---- --A--------C--------A----G---X----T---C---A---- --T--------C--------A----G---X----T---C---A---- --T--------C--------A----T---X----T---A---A---- --A--------C--------A----G---X----T---C---A---- --A--------C--------A----G---X----T---C---A---- --A--------C--------A----G---X----T---C---G---- --T--------C--------A----T---X----T---C---A---- --A--------C--------A----G---X----T---C---A---- --A--------C--------G----T---X----C---A---A---- --A--------C--------A----G---X----C---C---G---- Controls (unaffected)
  • 15. Indirect Association Cases (affected) --A--------C--------A----G---X----T---C---A---- --T--------G--------A----G---X----C---C---A---- --A--------G--------G----G---X----C---C---A---- --A--------C--------A----G---X----T---C---A---- --T--------C--------A----G---X----T---C---A---- --T--------C--------A----T---X----T---A---A---- --A--------C--------A----G---X----T---C---A---- --A--------C--------A----G---X----T---C---A---- --A--------C--------A----G---X----T---C---G---- --T--------C--------A----T---X----T---C---A---- --A--------C--------A----G---X----T---C---A---- --A--------C--------G----T---X----C---A---A---- --A--------C--------A----G---X----C---C---G---- Controls (unaffected)
  • 16. GWA Type 500k - 1m and get 3b
  • 17. GWA Type 500k - 1m and get 3b The common variants
  • 18. Multiple test issues 5% significance threshold means 5% false positives...
  • 19.
  • 23. Null distribution "Real" null distribution Alternative distribution
  • 25. GWA a successful approach ~500 validated findings for ~100 different traits
  • 26. GWA a successful approach ~500 validated findings for ~100 different traits ...but much genetic risk remains unexplained!
  • 27. Why?
  • 28. Why? • Rare variants? • We only tag common variants... • Gene-gene interaction? • Marginal effects vs interactions...
  • 30. Indirect Association Cases (affected) --A--------C--------A----G---X----T---C---A---- --T--------G--------A----G---X----C---C---A---- --A--------G--------G----G---X----C---C---A---- --A--------C--------A----G---X----T---C---A---- --T--------C--------A----G---X----T---C---A---- --T--------C--------A----T---X----T---A---A---- --A--------C--------A----G---X----T---C---A---- --A--------C--------A----G---X----T---C---A---- --A--------C--------A----G---X----T---C---G---- --T--------C--------A----T---X----T---C---A---- --A--------C--------A----G---X----T---C---A---- --A--------C--------G----T---X----C---A---A---- --A--------C--------A----G---X----C---C---G---- Controls (unaffected)
  • 31. Indirect Association Cases (affected) --A--------C--------A----G---X----T---C---A---- --T--------G--------A----G---X----C---C---A---- --A--------G--------G----G---X----C---C---A---- --A--------C--------A----G---X----T---C---A---- --T--------C--------A----G---X----T---C---A---- --T--------C--------A----T---X----T---A---A---- --A--------C--------A----G---X----T---C---A---- --A--------C--------A----G---X----T---C---A---- --A--------C--------A----G---X----T---C---G---- --T--------C--------A----T---X----T---C---A---- --A--------C--------A----G---X----T---C---A---- --A--------C--------G----T---X----C---A---A---- --A--------C--------A----G---X----C---C---G---- Controls (unaffected)
  • 32. Indirect Association Cases (affected) --A--------C--------A----G---X----T---C---A---- --T--------G--------A----G---X----C---C---A---- --A--------G--------G----G---X----C---C---A---- --A--------C--------A----G---X----T---C---A---- --T--------C--------A----G---X----T---C---A---- --T--------C--------A----T---X----T---A---A---- --A--------C--------A----G---X----T---C---A---- --A--------C--------A----G---X----T---C---A---- --A--------C--------A----G---X----T---C---G---- --T--------C--------A----T---X----T---C---A---- --A--------C--------A----G---X----T---C---A---- --A--------C--------G----T---X----C---A---A---- --A--------C--------A----G---X----C---C---G---- Controls (unaffected)
  • 33. Indirect Association Cases (affected) --A--------C--------A----G---X----T---C---A---- --T--------G--------A----G---X----C---C---A---- --A--------G--------G----G---X----C---C---A---- --A--------C--------A----G---X----T---C---A---- --T--------C--------A----G---X----T---C---A---- --T--------C--------A----T---X----T---A---A---- --A--------C--------A----G---X----T---C---A---- --A--------C--------A----G---X----T---C---A---- --A--------C--------A----G---X----T---C---G---- --T--------C--------A----T---X----T---C---A---- --A--------C--------A----G---X----T---C---A---- --A--------C--------G----T---X----C---A---A---- --A--------C--------A----G---X----C---C---G---- Controls (unaffected)
  • 34. Indirect Multi-Marker Association Cases (affected) --A--------C--------A----G---X----T---C---A---- --T--------G--------A----G---X----C---C---A---- --A--------G--------G----G---X----C---C---A---- --A--------C--------A----G---X----T---C---A---- --T--------C--------A----G---X----T---C---A---- --T--------C--------A----T---X----T---A---A---- --A--------C--------A----G---X----T---C---A---- --A--------C--------A----G---X----T---C---A---- --A--------C--------A----G---X----T---C---G---- --T--------C--------A----T---X----T---C---A---- --A--------C--------A----G---X----T---C---A---- --A--------C--------G----T---X----C---A---A---- --A--------C--------A----G---X----C---C---G---- Controls (unaffected)
  • 35. Local trees along the genome
  • 36. Local trees along the genome
  • 37. Local trees along the genome
  • 38. Local trees along the genome
  • 39. Trees and LD Tree similarity LD r2 Recombination rate Recombination rate
  • 40. Clustering on a tree Disease affecting mutation
  • 41. Clustering on a tree Complete penetrance Incomplete penetrance Spurious disease
  • 42. Clustering on a tree 25% Case/control clustering is not random on the tree... 75% 40% 60%
  • 43. Scoring the clustering Red=cases Green=controls Are the case chromosomes significantly over-represented in some clusters?
  • 44.
  • 45.
  • 46.
  • 49. A A A G G A 3 2 A A G 3 2 A G G 3 1.5 0 A G
  • 50. T T A A A T 2 3 A A A 2 3 A T T 3 1.5 0 T A
  • 51. A T A T A A AT 2 0 G A G A AA 1 1 GA 2 0 A A A A A A GT 0 2 G T G T 2 1 0 AT AA GA GT
  • 52. Explosion in complexity 500k markers gives us ~125 billion pairs!
  • 53. Explosion in complexity 500k markers gives us ~2·10 16 triplets
  • 54.
  • 55.
  • 56.
  • 57.
  • 58.
  • 59. • Using protein interaction networks we • Reduced ~125 billion tests to ~3-4 million • Reduced corrected significance threshold -8 from ~4·10-13 to ~9·10
  • 60.
  • 61.
  • 62. Perspectives... • Complete genome sequencing • No need for tagging • Rare variants • Structural variation • Pathway analysis • Analysis of pathways as a whole • Constructing tests from known pathways