SlideShare uma empresa Scribd logo
1 de 40
Baixar para ler offline
遺伝疫学研究デザイン

  東京大学 医学系研究科
    M1 倉橋一成



                1
遺伝研究
   2003年にヒトゲノム計画が完了
   ヒトゲノム:約30億塩基対,約22,000遺伝子
   これら遺伝子の形質を知りたい
    (ポストゲノム計画)
     Knowledge-based approach
    →実験的手法
     Statistics-based approach

    →統計的手法
                                  2
遺伝統計学の倫理的問題
   三省庁(文部科学省,厚生労働省,経済産業
    省)による倫理指針
   「ヒトゲノム,遺伝子解析のための倫理指針」
       倫理審査委員会による審査
       インフォームドコンセントの徹底
       個人情報の保護
       情報の開示
       遺伝カウンセリング
               http://www.mhlw.go.jp/houdou/0103/h0329-3.html

                                                          3
遺伝カウンセリング
   情報開示に伴う個人の心理的障害に対処
   遺伝子は…
     生涯変化しない
     個人だけでなく血縁者にも関係する

    →特に生殖細胞遺伝子の取り扱いに注意




                         4
遺伝統計学
   DNAアレイ,SNPアレイなどの発現解析
   遺伝疫学
       薬物の感受性
       有害事象の頻度
       遺伝子と環境との交互作用




                           5
遺伝子と環境の交互作用
 遺伝子や環境単独ではリスク無し
 遺伝子と環境の交互作用リスクは有り

例)妊娠期の喫煙,TGFα多型と口蓋リスクとの関係
        喫煙,TGFα多型のみではリスク無し
        喫煙とTGFα多型の交互作用リスクは有り
    喫煙    遺伝子型   ケース   コントロール オッズ比   95%信頼区間
     +      +     13      11   5.5     2.1-14.6
     +      -     13      69   0.9     0.4-1.8
     -      +      7      34   1.0     0.3-2.4
     -      -     36     167   1.0

                                             6
遺伝疫学の特徴
   疾患感受性遺伝子
       ケースコントロール研究
       マーカーによって疾患と相関のある遺伝子を同定
   遺伝子と環境との疾患に対する交互作用
   遺伝子診断はしばしば高価
   妥当なコントロールが不明
       ケースオンリー研究
       ケースの親族をコントロールとした研究
                                 7
今回紹介する研究デザイン
   Case-control study
   Case-only study
   Case-parental control study
       伝達不平衡テスト(TDT)
       家族内相関解析(AFBAC)
   Affected relative-pair study
       罹患同胞対解析

                                   8
遺伝に関する基礎知識
   DNA
       染色体
       遺伝子多型
       アレル
       座位(遺伝子座)
       塩基
   遺伝
       メンデルの法則
       表現型と形質
       連鎖         9
細胞
   生物の最小単位
   ヒトでは
       約数10兆個
        (体重1kgにつき1兆個)
       約220種




                        10
染色体
   DNAの集合体
   ほとんどが核の中に存在
   通常の細胞:23対(46本)
   全DNAを1ゲノムと表現
   約22,000の遺伝子
   遺伝子はゲノムの約数%

               染色体

                     染色分体   11
遺伝子
   染色体の一部
   遺伝子座(locus):遺伝子が存在する場所
   形質(trait):ある遺伝子座の役割
       疾患,薬剤感受性
   表現型(phenotype):形質を細かく表現
       疾患の有無,薬剤感受性の強弱
    形質

    染色体
                         ポストゲノム時代の遺伝統計学 12
遺伝子(つづき)
   アレル(allele):同遺伝子座に存在する対立遺伝子
   遺伝子型:2つのアレルで表現される
   多型(polymorphism):遺伝子やその産物の違い
   マーカー遺伝子:測定が容易な遺伝子
    遺伝子座
                 アレル   遺伝子型が決定
                       表現型が決定




           染色体                     13
ハプロタイプ(haplotype)
   2つの遺伝子座でのアレルの組み合わせ
   ディプロタイプ形:2つのハプロタイプの組み合わせ
            1    2       1       2




                     1       2
      ある遺伝子座のアレル




        ハプロタイプ                   ディプロタイプ形

                             ポストゲノム時代の遺伝統計学 14
Case-control study
   前提:適切なコントロールの選出
   曝露(環境)と遺伝子型はそれぞれ2分類
       遺伝子型:1つまたはいくつかの遺伝子座
        に存在するアレルによって決定
   曝露,遺伝子型,発病の2×4表を作成
    曝露      遺伝子型   ケース   コントロール
              +     a       b
        +
              -     c       d
              +     e       f
        -
              -     g       h     15
オッズ比
    曝露          遺伝子型        ケース   コントロール
                  +          a       b
        +
                  -          c       d
                  +          e       f
        -
                  -          g       h
ORe = ch dg , ORg = eh fg , OReg = ah bg
   交互作用の指標(synergy index)
                  ORge
        SIM =
                ORg × ORe
       1でなければ乗法モデルで交互作用有り                 16
遺伝子と疾患との関連
   交絡変数を調整したオッズ比
   まれな疾患の場合はリスク比に近似
   疾患と関連のあるアレルが疾患の原因とは
    限らない
       本当の疾患遺伝子と連鎖不平衡であるため検出
        された可能性
       集団の特徴によって変わる


                           17
連鎖(linkage)
   連鎖:アレル同士の子への分配が非独立
       遺伝子座Aとマーカー:連鎖不平衡
       遺伝子座Bとマーカー:連鎖平衡

    Pr :あるアレルが子供へ継承される確率
    m1 , m2 :マーカー1,2
        Pr ( A1m1 ) ≠ Pr ( A1 ) × Pr ( m1 )
        Pr (= Pr ( B1 ) × Pr ( m1 )
            B1m1 )
                                              18
妊娠期の喫煙,TGFα多型と
     口蓋リスクとの関係                             Hwang et al. 1995


        喫煙,遺伝子型のみではリスクなし
        同時リスクは約5.5倍(2.1-14.6倍)
            交互作用有り
喫煙       遺伝子型      ケース    コントロール    オッズ比    95%信頼区間
           +        13       11      5.5      2.1-14.6
+
           -        13       69      0.9      0.4-1.8
           +         7       34       1       0.3-2.4
-
           -        36      167       1

                       13 ×167 11× 36
SIM           = 6.57
             ( 7 ×167 34 × 36 ) × (13 ×167 69 × 36 )
                                                          19
Case-only study
   曝露(環境)と遺伝子型の交互作用に興味
   ケースのみを用いた2×2表
曝露       遺伝子型   ケース           遺伝子型
           +     a     曝露
+                            +    -
           -     c
           +     e
                        +    a    c
-                       -    e    g
           -     g
                    adfg bh
       COR SIM × Z
           =      =     × = ag ce
                    bceh df
    Z = 1 であればSIMとCORは一致する
        Z:コントロール群での曝露と遺伝子型とのオッズ比
                                      20
CORの解釈
   コントロール群で曝露と遺伝子型が独立
= 1, COR SIM
 Z =
       交互作用として解釈できる
   曝露や遺伝子型の単独の効果はわからない
   ロジスティックモデルにより共変量を考慮
                              Piegorsh et.al. 1944
       精密な推定値
   SIMは疾患に潜む病因の異質性を表現
                    Begg and Zhang 1994
   交絡要因を調整する事も可能
                                               21
妊娠期の喫煙,TGFα多型と
     口蓋リスクとの関係                     Hwang et al. 1995


喫煙    遺伝子型   ケース   コントロール   オッズ比    95%信頼区間
        +     13      11     5.5      2.1-14.6
+
        -     13      69     0.9      0.4-1.8
        +      7      34      1       0.3-2.4
-
        -     36     167      1

                 13 × 36
             = = 5.14
             COR
                 13 × 7
       11×167     5.14
    = = 0.78, SIM = 6.59
     Z         =
       69 × 34    0.78
   独立の仮定は満たされているであろう                             22
Case-only studyの注意点1
   ケースの選出法
       発症ケースが最も良い
   コントロール群での仮定
       通常の状況に比べて満たされる場合が多い
           栄養状態,喫煙,職業曝露,飲酒
       満たされない場合
           アルコール代謝酵素によるアルコール依存症や肝硬変
            などへのリスク
   曝露や遺伝子型単独の効果はわからない
                                   23
Case-only studyの注意点2
   検出されたアレルや遺伝子型と疾患との関係
       真の疾患感受性遺伝子との連鎖不平衡
   CORは乗法モデルでの交互作用と解釈
       疫学における正しい交互作用とは?
       SIMも加法モデルでの交互作用とは解釈できない
       多くの環境-遺伝交互作用は乗法モデルで記述



                             24
Parental control study
   コントロールの定義が不明確
   ケースの親類がコントロールとして理想的かも
       先祖が同じである
       親や兄弟をコントロールとする
   親をコントロールとする
       伝達不平衡テスト(TDT)
       ハプロタイプ相対リスク(HHRR)
       家族内相関解析(AFBAC)
                                 25
TDT
    (transmission disequilibrium test)

                                           non-transmitted allele
                      transmitted allele
    M/M         M/m                            M          m
                              M                a          b         a+b
                              m                c          d         c+d
                                              a+c        b+d         2n
          M/m
   マーカー座位MにアレルMとm
   両親を分割表に分類する
     父親:a,母親:c

    McNemar検定: 2 ( b − c )
                           2

                      χ td =                 ~ χ12
                                  b+c                                26
HHRR
    (Haplotype-based haplotype relative risk)

                                                allele
    M/M         M/m                           M         m
                            transmitted      a+b      c+d     2n
                          nontransmitted    a+c        b+d    2n
                                           2a+b+c    b+c+2d   4n
          M/m
   興味あるアレルの頻度を知りたい
     伝達された,又はされてないアレル中の頻度

    Pearsonの χ 検定を行う
                      2




                                                              27
AFBAC
       (affected family based control study)
   HRR(haplotype relative risk)に基づく
   両親の遺伝子型を基に仮想コントロールを設定
                              仮想コントロール
         M/M         M/m   M/M


               M/m

   Case-parental control studyも仮想コントロール
    を設定
                                          28
TDT,HHRR,AFBAC
   TDT
       アレルと疾患(遺伝子)との連鎖を検定
       少なくとも相関はあることが前提
           相関が無いと連鎖していても検出できない
   HHRR,AFBAC
       アレルと疾患(遺伝子)との相関を検定
       相関しているからといって連鎖しているとは限らない
       この方法を連鎖の検定に用いるとαエラーは大
                                  29
AFBAC
        (Case-parental control study)
   ケースとコントロールを分割表に分類
           genotype in   genotype in case
             control       +          -
               +           a          b
               -           c          d
       あるアレルや遺伝子型を持っているor持っていない
   マッチング表の解析
       全セルの合計はn(ペア)
   オッズ比: c b
                                            30
環境との交互作用
   曝露で層別
                   genotype in   genotype in case
        exposure
                     control       +          -
                       +           a          b
           +
                       -           c          d
                       +           e          f
           -
                       -           g          h

       曝露有り群のオッズ比:c b
       曝露無し群のオッズ比:g f
              cb
       これらの比    によって交互作用を確認
                       g f                          31
Flanders and Khouryの方法




                         32
Case-parental control study
        の特徴1
   コントロールが妥当であるか
       仮想コントロールの遺伝子型が生殖機能に関わっ
        ている場合
   生存や生殖に影響を及ぼさない遺伝子型
       大人になって発病するような疾患に有用
   親の遺伝子型が必要
       周産期に関わる疾患(先天異常など)に有用


                                      33
Case-parental control study
         の特徴2
   環境単独の効果はわからない
       曝露の有り無しで遺伝子型の効果が異なるかどうか
       環境と遺伝子型の交互作用はわかる
   遺伝子型単独の効果がわかる
       Case-only studyではわからなかった
   検出されたアレルや遺伝子型と疾患との関係
       真の疾患感受性遺伝子との連鎖不平衡

                                       34
Sib control study
   ケースの親族がコントロールとして適切
   発症年齢が高い疾患
       親の遺伝子型を調べることは困難
       罹患していない兄弟をコントロールとする
   同胞伝達不平衡テスト(S-TDT)
   罹患同胞対解析(affected sib-pair analysis)


                                     35
S-TDT
   家族毎(i)に分割表を考える
                                            genotype
                disease                  +                   -                total
                    +                    r+ i                r− i                 r⋅i
                    -                n+ i − r+ i         n− i − r− i          n⋅i − r⋅i
                  total                 n+ i                 n− i                 n⋅i
    ある遺伝子型の期待値からのずれをMantel-
     Haenszel testによって検定                                                                           
                                                                                                      2

                                                                                 ∑ ( r+ i − e+ i ) 
                                        n+ i n− i r⋅i ( n⋅i − r⋅i )
e+ i = r⋅i n+ i n⋅i , V [ r+ i − e+ i ] = 2                         , χ S −TDT =  i
                                                                        2                           
                                             n⋅i ( n⋅i − 1)                       ∑V [ r+i − e+i ]
                                                                                   i

                                                                                                          36
Affected sib-pair analysis
   兄弟間のIBD(identity by descent)を考える
       IBD:アレルが同祖である状態
       兄弟のIBDは期待的に・・・
           IBD=0:25%
           IBD=1:50%
           IBD=2:25%
   期待値からの乖離:連鎖の存在を示唆
   環境で層別することで交互作用を確認
       兄弟間で曝露が異なっていたら複雑になる
                                   37
環境との交互作用
                                            odds ratio
                 exposed
     IBD                       expected      exposed
             +             -                +        -
         0   a             d     0.25       1        1
         1   b             e      0.5     b/2a     e/2d
         2   c             f     0.25      c/a      f/d


    ここの比で交互作用を調べる

   IBDの分布の偏りは尤度比で検定する
        尤度比の対数:LOD値

                                                          38
Affected sib-pair analysisの特徴
   疾患感受性を増加させる遺伝子座を調査
       家族に2人以上の患者が必要
       サンプルサイズの減少
   ケース同士のIBD
       親や親戚の情報が必要
   特定のアレルの疾病への影響はわからない
   環境単独の効果はわからない
   メンデルの法則が崩れると妥当ではない
                                        39
まとめ
   遺伝子と環境の交互作用を確かめる様々な方法
   外的なコントロールは利用しない
   疾病の機序が複雑な場合
       特定の交互作用を検出することは難しい
   ケースコントロール研究に勝ることは無い
   交互作用を調べるためには充分に有用である


                             40

Mais conteúdo relacionado

Mais procurados

Risk based portfolio with large dynamic covariance matrices
Risk based portfolio with large dynamic covariance matricesRisk based portfolio with large dynamic covariance matrices
Risk based portfolio with large dynamic covariance matricesKei Nakagawa
 
【DL輪読会】Scaling laws for single-agent reinforcement learning
【DL輪読会】Scaling laws for single-agent reinforcement learning【DL輪読会】Scaling laws for single-agent reinforcement learning
【DL輪読会】Scaling laws for single-agent reinforcement learningDeep Learning JP
 
FreeCAD OpenFOAM Workbenchセットアップ方法と課題
FreeCAD OpenFOAM Workbenchセットアップ方法と課題FreeCAD OpenFOAM Workbenchセットアップ方法と課題
FreeCAD OpenFOAM Workbenchセットアップ方法と課題murai1972
 
非線形データの次元圧縮 150905 WACODE 2nd
非線形データの次元圧縮 150905 WACODE 2nd非線形データの次元圧縮 150905 WACODE 2nd
非線形データの次元圧縮 150905 WACODE 2ndMika Yoshimura
 
OpenFOAM -回転領域を含む流体計算 (Rotating Geometry)-
OpenFOAM -回転領域を含む流体計算 (Rotating Geometry)-OpenFOAM -回転領域を含む流体計算 (Rotating Geometry)-
OpenFOAM -回転領域を含む流体計算 (Rotating Geometry)-Fumiya Nozaki
 
幾何を使った統計のはなし
幾何を使った統計のはなし幾何を使った統計のはなし
幾何を使った統計のはなしToru Imai
 
CF-FinML 金融時系列予測のための機械学習
CF-FinML 金融時系列予測のための機械学習CF-FinML 金融時系列予測のための機械学習
CF-FinML 金融時系列予測のための機械学習Katsuya Ito
 
Outrageously Large Neural Networks:The Sparsely-Gated Mixture-of-Experts Laye...
Outrageously Large Neural Networks:The Sparsely-Gated Mixture-of-Experts Laye...Outrageously Large Neural Networks:The Sparsely-Gated Mixture-of-Experts Laye...
Outrageously Large Neural Networks:The Sparsely-Gated Mixture-of-Experts Laye...KCS Keio Computer Society
 
(DL Hacks輪読) How transferable are features in deep neural networks?
(DL Hacks輪読) How transferable are features in deep neural networks?(DL Hacks輪読) How transferable are features in deep neural networks?
(DL Hacks輪読) How transferable are features in deep neural networks?Masahiro Suzuki
 
RでGARCHモデル - TokyoR #21
RでGARCHモデル - TokyoR #21RでGARCHモデル - TokyoR #21
RでGARCHモデル - TokyoR #21horihorio
 
Granger因果による 時系列データの因果推定(因果フェス2015)
Granger因果による時系列データの因果推定(因果フェス2015)Granger因果による時系列データの因果推定(因果フェス2015)
Granger因果による 時系列データの因果推定(因果フェス2015)Takashi J OZAKI
 
About chtMultiRegionFoam
About chtMultiRegionFoam About chtMultiRegionFoam
About chtMultiRegionFoam 守淑 田村
 
【DL輪読会】Semi-Parametric Neural Image Synthesis
【DL輪読会】Semi-Parametric Neural Image Synthesis【DL輪読会】Semi-Parametric Neural Image Synthesis
【DL輪読会】Semi-Parametric Neural Image SynthesisDeep Learning JP
 
Genetic algorithm full scratch with R
Genetic algorithm full scratch with RGenetic algorithm full scratch with R
Genetic algorithm full scratch with RSatoshi Kato
 
一般化線形混合モデル入門の入門
一般化線形混合モデル入門の入門一般化線形混合モデル入門の入門
一般化線形混合モデル入門の入門Yu Tamura
 
FDRの使い方 (Kashiwa.R #3)
FDRの使い方 (Kashiwa.R #3)FDRの使い方 (Kashiwa.R #3)
FDRの使い方 (Kashiwa.R #3)Haruka Ozaki
 
自動微分変分ベイズ法の紹介
自動微分変分ベイズ法の紹介自動微分変分ベイズ法の紹介
自動微分変分ベイズ法の紹介Taku Yoshioka
 
細胞外電極はなにを見ているか2017年5月版
細胞外電極はなにを見ているか2017年5月版細胞外電極はなにを見ているか2017年5月版
細胞外電極はなにを見ているか2017年5月版Masatoshi Yoshida
 
一般線形モデル
一般線形モデル一般線形モデル
一般線形モデルMatsuiRyo
 

Mais procurados (20)

Risk based portfolio with large dynamic covariance matrices
Risk based portfolio with large dynamic covariance matricesRisk based portfolio with large dynamic covariance matrices
Risk based portfolio with large dynamic covariance matrices
 
【DL輪読会】Scaling laws for single-agent reinforcement learning
【DL輪読会】Scaling laws for single-agent reinforcement learning【DL輪読会】Scaling laws for single-agent reinforcement learning
【DL輪読会】Scaling laws for single-agent reinforcement learning
 
Mplus tutorial
Mplus tutorialMplus tutorial
Mplus tutorial
 
FreeCAD OpenFOAM Workbenchセットアップ方法と課題
FreeCAD OpenFOAM Workbenchセットアップ方法と課題FreeCAD OpenFOAM Workbenchセットアップ方法と課題
FreeCAD OpenFOAM Workbenchセットアップ方法と課題
 
非線形データの次元圧縮 150905 WACODE 2nd
非線形データの次元圧縮 150905 WACODE 2nd非線形データの次元圧縮 150905 WACODE 2nd
非線形データの次元圧縮 150905 WACODE 2nd
 
OpenFOAM -回転領域を含む流体計算 (Rotating Geometry)-
OpenFOAM -回転領域を含む流体計算 (Rotating Geometry)-OpenFOAM -回転領域を含む流体計算 (Rotating Geometry)-
OpenFOAM -回転領域を含む流体計算 (Rotating Geometry)-
 
幾何を使った統計のはなし
幾何を使った統計のはなし幾何を使った統計のはなし
幾何を使った統計のはなし
 
CF-FinML 金融時系列予測のための機械学習
CF-FinML 金融時系列予測のための機械学習CF-FinML 金融時系列予測のための機械学習
CF-FinML 金融時系列予測のための機械学習
 
Outrageously Large Neural Networks:The Sparsely-Gated Mixture-of-Experts Laye...
Outrageously Large Neural Networks:The Sparsely-Gated Mixture-of-Experts Laye...Outrageously Large Neural Networks:The Sparsely-Gated Mixture-of-Experts Laye...
Outrageously Large Neural Networks:The Sparsely-Gated Mixture-of-Experts Laye...
 
(DL Hacks輪読) How transferable are features in deep neural networks?
(DL Hacks輪読) How transferable are features in deep neural networks?(DL Hacks輪読) How transferable are features in deep neural networks?
(DL Hacks輪読) How transferable are features in deep neural networks?
 
RでGARCHモデル - TokyoR #21
RでGARCHモデル - TokyoR #21RでGARCHモデル - TokyoR #21
RでGARCHモデル - TokyoR #21
 
Granger因果による 時系列データの因果推定(因果フェス2015)
Granger因果による時系列データの因果推定(因果フェス2015)Granger因果による時系列データの因果推定(因果フェス2015)
Granger因果による 時系列データの因果推定(因果フェス2015)
 
About chtMultiRegionFoam
About chtMultiRegionFoam About chtMultiRegionFoam
About chtMultiRegionFoam
 
【DL輪読会】Semi-Parametric Neural Image Synthesis
【DL輪読会】Semi-Parametric Neural Image Synthesis【DL輪読会】Semi-Parametric Neural Image Synthesis
【DL輪読会】Semi-Parametric Neural Image Synthesis
 
Genetic algorithm full scratch with R
Genetic algorithm full scratch with RGenetic algorithm full scratch with R
Genetic algorithm full scratch with R
 
一般化線形混合モデル入門の入門
一般化線形混合モデル入門の入門一般化線形混合モデル入門の入門
一般化線形混合モデル入門の入門
 
FDRの使い方 (Kashiwa.R #3)
FDRの使い方 (Kashiwa.R #3)FDRの使い方 (Kashiwa.R #3)
FDRの使い方 (Kashiwa.R #3)
 
自動微分変分ベイズ法の紹介
自動微分変分ベイズ法の紹介自動微分変分ベイズ法の紹介
自動微分変分ベイズ法の紹介
 
細胞外電極はなにを見ているか2017年5月版
細胞外電極はなにを見ているか2017年5月版細胞外電極はなにを見ているか2017年5月版
細胞外電極はなにを見ているか2017年5月版
 
一般線形モデル
一般線形モデル一般線形モデル
一般線形モデル
 

Mais de Issei Kurahashi

おしゃスタ@リクルート
おしゃスタ@リクルートおしゃスタ@リクルート
おしゃスタ@リクルートIssei Kurahashi
 
【スクー】業務改善のためのデータサイエンス
【スクー】業務改善のためのデータサイエンス【スクー】業務改善のためのデータサイエンス
【スクー】業務改善のためのデータサイエンスIssei Kurahashi
 
データサイエンティストになるために
データサイエンティストになるためにデータサイエンティストになるために
データサイエンティストになるためにIssei Kurahashi
 
Tokyo webmining統計学部 第2回
Tokyo webmining統計学部 第2回Tokyo webmining統計学部 第2回
Tokyo webmining統計学部 第2回Issei Kurahashi
 
おしゃスタVI 倉橋
おしゃスタVI 倉橋おしゃスタVI 倉橋
おしゃスタVI 倉橋Issei Kurahashi
 
TokyoWebmining統計学部 第1回
TokyoWebmining統計学部 第1回TokyoWebmining統計学部 第1回
TokyoWebmining統計学部 第1回Issei Kurahashi
 
コホート研究 isseing333
コホート研究 isseing333コホート研究 isseing333
コホート研究 isseing333Issei Kurahashi
 
一般化線形混合モデル isseing333
一般化線形混合モデル isseing333一般化線形混合モデル isseing333
一般化線形混合モデル isseing333Issei Kurahashi
 
生物統計特論6資料 2006 abc法(bootstrap) isseing333
生物統計特論6資料 2006 abc法(bootstrap) isseing333生物統計特論6資料 2006 abc法(bootstrap) isseing333
生物統計特論6資料 2006 abc法(bootstrap) isseing333Issei Kurahashi
 
生物統計特論3資料 2006 ギブス MCMC isseing333
生物統計特論3資料 2006 ギブス MCMC isseing333生物統計特論3資料 2006 ギブス MCMC isseing333
生物統計特論3資料 2006 ギブス MCMC isseing333Issei Kurahashi
 
Analysis of clinical trials using sas 勉強用 isseing333
Analysis of clinical trials using sas 勉強用 isseing333Analysis of clinical trials using sas 勉強用 isseing333
Analysis of clinical trials using sas 勉強用 isseing333Issei Kurahashi
 
統計的因果推論 勉強用 isseing333
統計的因果推論 勉強用 isseing333統計的因果推論 勉強用 isseing333
統計的因果推論 勉強用 isseing333Issei Kurahashi
 

Mais de Issei Kurahashi (19)

おしゃスタ@リクルート
おしゃスタ@リクルートおしゃスタ@リクルート
おしゃスタ@リクルート
 
【スクー】業務改善のためのデータサイエンス
【スクー】業務改善のためのデータサイエンス【スクー】業務改善のためのデータサイエンス
【スクー】業務改善のためのデータサイエンス
 
データサイエンティストになるために
データサイエンティストになるためにデータサイエンティストになるために
データサイエンティストになるために
 
Tokyo webmining統計学部 第2回
Tokyo webmining統計学部 第2回Tokyo webmining統計学部 第2回
Tokyo webmining統計学部 第2回
 
おしゃスタVI 倉橋
おしゃスタVI 倉橋おしゃスタVI 倉橋
おしゃスタVI 倉橋
 
おしゃスタat銀座
おしゃスタat銀座おしゃスタat銀座
おしゃスタat銀座
 
TokyoWebmining統計学部 第1回
TokyoWebmining統計学部 第1回TokyoWebmining統計学部 第1回
TokyoWebmining統計学部 第1回
 
iAnalysis NY視察
iAnalysis NY視察 iAnalysis NY視察
iAnalysis NY視察
 
おしゃスタV
おしゃスタVおしゃスタV
おしゃスタV
 
平方和の分解
平方和の分解平方和の分解
平方和の分解
 
コホート研究 isseing333
コホート研究 isseing333コホート研究 isseing333
コホート研究 isseing333
 
一般化線形混合モデル isseing333
一般化線形混合モデル isseing333一般化線形混合モデル isseing333
一般化線形混合モデル isseing333
 
生物統計特論6資料 2006 abc法(bootstrap) isseing333
生物統計特論6資料 2006 abc法(bootstrap) isseing333生物統計特論6資料 2006 abc法(bootstrap) isseing333
生物統計特論6資料 2006 abc法(bootstrap) isseing333
 
生物統計特論3資料 2006 ギブス MCMC isseing333
生物統計特論3資料 2006 ギブス MCMC isseing333生物統計特論3資料 2006 ギブス MCMC isseing333
生物統計特論3資料 2006 ギブス MCMC isseing333
 
Analysis of clinical trials using sas 勉強用 isseing333
Analysis of clinical trials using sas 勉強用 isseing333Analysis of clinical trials using sas 勉強用 isseing333
Analysis of clinical trials using sas 勉強用 isseing333
 
統計概論 isseing333
統計概論 isseing333統計概論 isseing333
統計概論 isseing333
 
統計的因果推論 勉強用 isseing333
統計的因果推論 勉強用 isseing333統計的因果推論 勉強用 isseing333
統計的因果推論 勉強用 isseing333
 
分布 isseing333
分布 isseing333分布 isseing333
分布 isseing333
 
データ解析
データ解析データ解析
データ解析
 

遺伝疫学研究デザイン isseing333

  • 1. 遺伝疫学研究デザイン 東京大学 医学系研究科 M1 倉橋一成 1
  • 2. 遺伝研究  2003年にヒトゲノム計画が完了  ヒトゲノム:約30億塩基対,約22,000遺伝子  これら遺伝子の形質を知りたい (ポストゲノム計画)  Knowledge-based approach →実験的手法  Statistics-based approach →統計的手法 2
  • 3. 遺伝統計学の倫理的問題  三省庁(文部科学省,厚生労働省,経済産業 省)による倫理指針  「ヒトゲノム,遺伝子解析のための倫理指針」  倫理審査委員会による審査  インフォームドコンセントの徹底  個人情報の保護  情報の開示  遺伝カウンセリング http://www.mhlw.go.jp/houdou/0103/h0329-3.html 3
  • 4. 遺伝カウンセリング  情報開示に伴う個人の心理的障害に対処  遺伝子は…  生涯変化しない  個人だけでなく血縁者にも関係する →特に生殖細胞遺伝子の取り扱いに注意 4
  • 5. 遺伝統計学  DNAアレイ,SNPアレイなどの発現解析  遺伝疫学  薬物の感受性  有害事象の頻度  遺伝子と環境との交互作用 5
  • 6. 遺伝子と環境の交互作用  遺伝子や環境単独ではリスク無し  遺伝子と環境の交互作用リスクは有り 例)妊娠期の喫煙,TGFα多型と口蓋リスクとの関係  喫煙,TGFα多型のみではリスク無し  喫煙とTGFα多型の交互作用リスクは有り 喫煙 遺伝子型 ケース コントロール オッズ比 95%信頼区間 + + 13 11 5.5 2.1-14.6 + - 13 69 0.9 0.4-1.8 - + 7 34 1.0 0.3-2.4 - - 36 167 1.0 6
  • 7. 遺伝疫学の特徴  疾患感受性遺伝子  ケースコントロール研究  マーカーによって疾患と相関のある遺伝子を同定  遺伝子と環境との疾患に対する交互作用  遺伝子診断はしばしば高価  妥当なコントロールが不明  ケースオンリー研究  ケースの親族をコントロールとした研究 7
  • 8. 今回紹介する研究デザイン  Case-control study  Case-only study  Case-parental control study  伝達不平衡テスト(TDT)  家族内相関解析(AFBAC)  Affected relative-pair study  罹患同胞対解析 8
  • 9. 遺伝に関する基礎知識  DNA  染色体  遺伝子多型  アレル  座位(遺伝子座)  塩基  遺伝  メンデルの法則  表現型と形質  連鎖 9
  • 10. 細胞  生物の最小単位  ヒトでは  約数10兆個 (体重1kgにつき1兆個)  約220種 10
  • 11. 染色体  DNAの集合体  ほとんどが核の中に存在  通常の細胞:23対(46本)  全DNAを1ゲノムと表現  約22,000の遺伝子  遺伝子はゲノムの約数% 染色体 染色分体 11
  • 12. 遺伝子  染色体の一部  遺伝子座(locus):遺伝子が存在する場所  形質(trait):ある遺伝子座の役割  疾患,薬剤感受性  表現型(phenotype):形質を細かく表現  疾患の有無,薬剤感受性の強弱 形質 染色体 ポストゲノム時代の遺伝統計学 12
  • 13. 遺伝子(つづき)  アレル(allele):同遺伝子座に存在する対立遺伝子  遺伝子型:2つのアレルで表現される  多型(polymorphism):遺伝子やその産物の違い  マーカー遺伝子:測定が容易な遺伝子 遺伝子座 アレル 遺伝子型が決定 表現型が決定 染色体 13
  • 14. ハプロタイプ(haplotype)  2つの遺伝子座でのアレルの組み合わせ  ディプロタイプ形:2つのハプロタイプの組み合わせ 1 2 1 2 1 2 ある遺伝子座のアレル ハプロタイプ ディプロタイプ形 ポストゲノム時代の遺伝統計学 14
  • 15. Case-control study  前提:適切なコントロールの選出  曝露(環境)と遺伝子型はそれぞれ2分類  遺伝子型:1つまたはいくつかの遺伝子座 に存在するアレルによって決定  曝露,遺伝子型,発病の2×4表を作成 曝露 遺伝子型 ケース コントロール + a b + - c d + e f - - g h 15
  • 16. オッズ比 曝露 遺伝子型 ケース コントロール + a b + - c d + e f - - g h ORe = ch dg , ORg = eh fg , OReg = ah bg  交互作用の指標(synergy index) ORge SIM = ORg × ORe  1でなければ乗法モデルで交互作用有り 16
  • 17. 遺伝子と疾患との関連  交絡変数を調整したオッズ比  まれな疾患の場合はリスク比に近似  疾患と関連のあるアレルが疾患の原因とは 限らない  本当の疾患遺伝子と連鎖不平衡であるため検出 された可能性  集団の特徴によって変わる 17
  • 18. 連鎖(linkage)  連鎖:アレル同士の子への分配が非独立  遺伝子座Aとマーカー:連鎖不平衡  遺伝子座Bとマーカー:連鎖平衡 Pr :あるアレルが子供へ継承される確率 m1 , m2 :マーカー1,2 Pr ( A1m1 ) ≠ Pr ( A1 ) × Pr ( m1 ) Pr (= Pr ( B1 ) × Pr ( m1 ) B1m1 ) 18
  • 19. 妊娠期の喫煙,TGFα多型と 口蓋リスクとの関係 Hwang et al. 1995  喫煙,遺伝子型のみではリスクなし  同時リスクは約5.5倍(2.1-14.6倍)  交互作用有り 喫煙 遺伝子型 ケース コントロール オッズ比 95%信頼区間 + 13 11 5.5 2.1-14.6 + - 13 69 0.9 0.4-1.8 + 7 34 1 0.3-2.4 - - 36 167 1 13 ×167 11× 36 SIM = 6.57 ( 7 ×167 34 × 36 ) × (13 ×167 69 × 36 ) 19
  • 20. Case-only study  曝露(環境)と遺伝子型の交互作用に興味  ケースのみを用いた2×2表 曝露 遺伝子型 ケース 遺伝子型 + a 曝露 + + - - c + e + a c - - e g - g adfg bh COR SIM × Z = = × = ag ce bceh df  Z = 1 であればSIMとCORは一致する  Z:コントロール群での曝露と遺伝子型とのオッズ比 20
  • 21. CORの解釈  コントロール群で曝露と遺伝子型が独立 = 1, COR SIM  Z =  交互作用として解釈できる  曝露や遺伝子型の単独の効果はわからない  ロジスティックモデルにより共変量を考慮 Piegorsh et.al. 1944  精密な推定値  SIMは疾患に潜む病因の異質性を表現 Begg and Zhang 1994  交絡要因を調整する事も可能 21
  • 22. 妊娠期の喫煙,TGFα多型と 口蓋リスクとの関係 Hwang et al. 1995 喫煙 遺伝子型 ケース コントロール オッズ比 95%信頼区間 + 13 11 5.5 2.1-14.6 + - 13 69 0.9 0.4-1.8 + 7 34 1 0.3-2.4 - - 36 167 1 13 × 36 = = 5.14 COR 13 × 7 11×167 5.14 = = 0.78, SIM = 6.59 Z = 69 × 34 0.78  独立の仮定は満たされているであろう 22
  • 23. Case-only studyの注意点1  ケースの選出法  発症ケースが最も良い  コントロール群での仮定  通常の状況に比べて満たされる場合が多い  栄養状態,喫煙,職業曝露,飲酒  満たされない場合  アルコール代謝酵素によるアルコール依存症や肝硬変 などへのリスク  曝露や遺伝子型単独の効果はわからない 23
  • 24. Case-only studyの注意点2  検出されたアレルや遺伝子型と疾患との関係  真の疾患感受性遺伝子との連鎖不平衡  CORは乗法モデルでの交互作用と解釈  疫学における正しい交互作用とは?  SIMも加法モデルでの交互作用とは解釈できない  多くの環境-遺伝交互作用は乗法モデルで記述 24
  • 25. Parental control study  コントロールの定義が不明確  ケースの親類がコントロールとして理想的かも  先祖が同じである  親や兄弟をコントロールとする  親をコントロールとする  伝達不平衡テスト(TDT)  ハプロタイプ相対リスク(HHRR)  家族内相関解析(AFBAC) 25
  • 26. TDT (transmission disequilibrium test) non-transmitted allele transmitted allele M/M M/m M m M a b a+b m c d c+d a+c b+d 2n M/m  マーカー座位MにアレルMとm  両親を分割表に分類する  父親:a,母親:c McNemar検定: 2 ( b − c ) 2  χ td = ~ χ12 b+c 26
  • 27. HHRR (Haplotype-based haplotype relative risk) allele M/M M/m M m transmitted a+b c+d 2n nontransmitted a+c b+d 2n 2a+b+c b+c+2d 4n M/m  興味あるアレルの頻度を知りたい  伝達された,又はされてないアレル中の頻度 Pearsonの χ 検定を行う 2  27
  • 28. AFBAC (affected family based control study)  HRR(haplotype relative risk)に基づく  両親の遺伝子型を基に仮想コントロールを設定 仮想コントロール M/M M/m M/M M/m  Case-parental control studyも仮想コントロール を設定 28
  • 29. TDT,HHRR,AFBAC  TDT  アレルと疾患(遺伝子)との連鎖を検定  少なくとも相関はあることが前提  相関が無いと連鎖していても検出できない  HHRR,AFBAC  アレルと疾患(遺伝子)との相関を検定  相関しているからといって連鎖しているとは限らない  この方法を連鎖の検定に用いるとαエラーは大 29
  • 30. AFBAC (Case-parental control study)  ケースとコントロールを分割表に分類 genotype in genotype in case control + - + a b - c d  あるアレルや遺伝子型を持っているor持っていない  マッチング表の解析  全セルの合計はn(ペア)  オッズ比: c b 30
  • 31. 環境との交互作用  曝露で層別 genotype in genotype in case exposure control + - + a b + - c d + e f - - g h  曝露有り群のオッズ比:c b  曝露無し群のオッズ比:g f cb  これらの比 によって交互作用を確認 g f 31
  • 33. Case-parental control study の特徴1  コントロールが妥当であるか  仮想コントロールの遺伝子型が生殖機能に関わっ ている場合  生存や生殖に影響を及ぼさない遺伝子型  大人になって発病するような疾患に有用  親の遺伝子型が必要  周産期に関わる疾患(先天異常など)に有用 33
  • 34. Case-parental control study の特徴2  環境単独の効果はわからない  曝露の有り無しで遺伝子型の効果が異なるかどうか  環境と遺伝子型の交互作用はわかる  遺伝子型単独の効果がわかる  Case-only studyではわからなかった  検出されたアレルや遺伝子型と疾患との関係  真の疾患感受性遺伝子との連鎖不平衡 34
  • 35. Sib control study  ケースの親族がコントロールとして適切  発症年齢が高い疾患  親の遺伝子型を調べることは困難  罹患していない兄弟をコントロールとする  同胞伝達不平衡テスト(S-TDT)  罹患同胞対解析(affected sib-pair analysis) 35
  • 36. S-TDT  家族毎(i)に分割表を考える genotype disease + - total + r+ i r− i r⋅i - n+ i − r+ i n− i − r− i n⋅i − r⋅i total n+ i n− i n⋅i  ある遺伝子型の期待値からのずれをMantel- Haenszel testによって検定   2 ∑ ( r+ i − e+ i )  n+ i n− i r⋅i ( n⋅i − r⋅i ) e+ i = r⋅i n+ i n⋅i , V [ r+ i − e+ i ] = 2 , χ S −TDT =  i 2  n⋅i ( n⋅i − 1) ∑V [ r+i − e+i ] i 36
  • 37. Affected sib-pair analysis  兄弟間のIBD(identity by descent)を考える  IBD:アレルが同祖である状態  兄弟のIBDは期待的に・・・  IBD=0:25%  IBD=1:50%  IBD=2:25%  期待値からの乖離:連鎖の存在を示唆  環境で層別することで交互作用を確認  兄弟間で曝露が異なっていたら複雑になる 37
  • 38. 環境との交互作用 odds ratio exposed IBD expected exposed + - + - 0 a d 0.25 1 1 1 b e 0.5 b/2a e/2d 2 c f 0.25 c/a f/d ここの比で交互作用を調べる  IBDの分布の偏りは尤度比で検定する  尤度比の対数:LOD値 38
  • 39. Affected sib-pair analysisの特徴  疾患感受性を増加させる遺伝子座を調査  家族に2人以上の患者が必要  サンプルサイズの減少  ケース同士のIBD  親や親戚の情報が必要  特定のアレルの疾病への影響はわからない  環境単独の効果はわからない  メンデルの法則が崩れると妥当ではない 39
  • 40. まとめ  遺伝子と環境の交互作用を確かめる様々な方法  外的なコントロールは利用しない  疾病の機序が複雑な場合  特定の交互作用を検出することは難しい  ケースコントロール研究に勝ることは無い  交互作用を調べるためには充分に有用である 40