SlideShare uma empresa Scribd logo
1 de 28
Baixar para ler offline
因果推論の基礎 
――ミクロ計量経済学の最近の潮流から―― 
森田果y 
hatsuru@law.tohoku.ac.jp 
y 東北大学大学院法学研究科 
法社会学会関東研究支部定例研究会(早稲田大学) 
2014 年12 月13 日 
森田(東北大) 実証分析入門演習Dec 13, 2014 1 / 28
Introduction 
Outline 
1 Introduction 
2 因果推論の根本問題 
3 因果推論の前提条件 
4 割当メカニズムの重要性 
5 ランダム化:特殊な割当メカニズム 
6 さまざまな因果推論の手法 
7 因果推論と構造推定 
森田(東北大) 実証分析入門演習Dec 13, 2014 2 / 28
Introduction 
伝統的な法学における実証分析の利用 
記述的推論 
データを要約統計量(summary statistics)・記述統計量(descritive 
statistics) の形にまとめる 
mean, median, maximum/minimum, variance など 
これだけでも,〔上手に行えば――King et al 1994〕分かることは結構 
ある 
相関関係(correlation, association) の計算 
基本的にはOLS(最小二乗法による線形回帰)やクロス集計 
差の検定 
e.g., 男女(の平均賃金etc)の間に有意な差があるかどうかの検定 
森田(東北大) 実証分析入門演習Dec 13, 2014 3 / 28
Introduction 
最近の法学研究における実証分析の利用 
より政策的な方向へ 
consequentialism | 法ルールがその目的を達成できているかどうか? 
program evaluation と呼ばれる分野との接合 
単なる記述的推論ではなく,因果推論(causal inference)の重視 
相関関係ではなく,因果関係の評価 
経済学や政治学でのトレンドを反映 
医療でのEBM なども因果推論の世界(統計学の世界では裏でつな 
がっている) 
因果推論では,推定手法(統計ソフトウェアが計算してくれる部分) 
よりも,リサーチデザイン(どこに因果関係を見いだすか,うまく 
仕組む)ことの方が重要 
森田(東北大) 実証分析入門演習Dec 13, 2014 4 / 28
因果推論の根本問題 
Outline 
1 Introduction 
2 因果推論の根本問題 
3 因果推論の前提条件 
4 割当メカニズムの重要性 
5 ランダム化:特殊な割当メカニズム 
6 さまざまな因果推論の手法 
7 因果推論と構造推定 
森田(東北大) 実証分析入門演習Dec 13, 2014 5 / 28
因果推論の根本問題 
基本概念 
a la RCM (Rubin Causal Model) 
unit: 対象 
treatment: 介入がなかった場合(=control)と比較して,それが 
あった場合の効果を測定したいと考えている(政策)介入 
potential outcomes: ユニットにtreatment があった場合となかった 
場合について,ユニットが取り得る(=まだ観察されていないもの 
である点に注意!)値 
counterfactual: 実現しなかった方のpotential outcome 
causal effect: 1 つ1 つのユニットについて,treatment があった場合 
のpotential outcome とtreatment がなかった場合のpotential 
outcome との間の差 
`The Fundamental Problem of Causal Inference': 私たちは,複数の 
potential outcome のうち,最大で1 個しか観察することはできない 
から,causal effect を直接観察することはできない 
森田(東北大) 実証分析入門演習Dec 13, 2014 6 / 28
因果推論の根本問題 
具体例:単純な差分をとる場合 
ユニット=ある時点の「私」。頭痛がある。 
treatment =頭痛薬アスピリンの投与。 
Y = 2 時間後の「私」の頭痛の評価。treatment の有無で,2 通りあ 
り得る。 
Unit 当初の頭痛potential outcomes Y へのcausal effect 
X Y (Asp) Y (Not) Y (Asp)  Y (Not) 
「私」80 25 75 -50 
森田(東北大) 実証分析入門演習Dec 13, 2014 7 / 28
因果推論の前提条件 
Outline 
1 Introduction 
2 因果推論の根本問題 
3 因果推論の前提条件 
4 割当メカニズムの重要性 
5 ランダム化:特殊な割当メカニズム 
6 さまざまな因果推論の手法 
7 因果推論と構造推定 
森田(東北大) 実証分析入門演習Dec 13, 2014 8 / 28
因果推論の前提条件 
基本概念:因果推論のための前提条件 
replication: 少なくとも1 つのユニットはtreatment を受け,少なく 
とも1 つのユニットはtreatment を受けない(control)。複数の対象 
の間のvariation でもいいし,単一の対象が異なる時点でvariation が 
あってもよい。 
SUTVA (stable unit-treatment-value assumption):2 つの内容がある 
a) 1 つ1 つのユニットについて,同時で1 つのtreatment しか働かず, 
control も1 種類しかない 
b) ユニット間に干渉がない(spill over effect や一般均衡効果は存在し 
ない) 
assignment mechanism: どのユニットがtreatment を受け,どのユ 
ニットがcontrol になるかを決定するメカニズム 
森田(東北大) 実証分析入門演習Dec 13, 2014 9 / 28
因果推論の前提条件 
Nユニット・処置2 つで,SUTVA が満たされるケース 
Unit X Y (1) Y (0) ユニットレベルの因果効果 
1 X1 Y1(1) Y1(0) Y1(1)  Y1(0) 
2 X2 Y2(1) Y2(0) Y2(1)  Y2(0) 
... 
... 
... 
... 
... 
i Xi Yi(1) Yi(0) Yi(1)  Yi(0) 
... 
... 
... 
... 
... 
N XN YN(1) YN(0) YN(1)  YN(0) 
森田(東北大) 実証分析入門演習Dec 13, 2014 10 / 28
因果推論の前提条件 
population level の因果効果 
Yi(1) とYi(0) を比較するのが基本 
ただし,このようなユニットレベル因果効果を直接観察することは不 
可能なので,代わりに... 
1 と0 との間の平均因果効果average causal effect 
Ave[Yi(1)  Yi(0)] = 1 
N 
ΣN 
i=1(Yi(1)  Yi(0)) 
1 と0 との間のメディアン因果効果 
Median[Yi(1)  Yi(0)] 
などなど... を推定していくことになる 
森田(東北大) 実証分析入門演習Dec 13, 2014 11 / 28
割当メカニズムの重要性 
Outline 
1 Introduction 
2 因果推論の根本問題 
3 因果推論の前提条件 
4 割当メカニズムの重要性 
5 ランダム化:特殊な割当メカニズム 
6 さまざまな因果推論の手法 
7 因果推論と構造推定 
森田(東北大) 実証分析入門演習Dec 13, 2014 12 / 28
割当メカニズムの重要性 
割当メカニズム 
具体例=完璧な医者 
Potential Outcomes 
Unit Control Y (0) Treatment Y (1) 
1 13 14 
2 6 0 
3 4 1 
4 5 2 
5 6 3 
6 6 1 
7 8 10 
8 8 9 
`true' average 7 5 
average causal effect = -2 
森田(東北大) 実証分析入門演習Dec 13, 2014 13 / 28
割当メカニズムの重要性 
割当メカニズム 
完璧な医者が,一人一人について最適な治療方法を適用すると: 
W は,treatment のあり(1) なし(0) を示す 
Potential Outcomes 
Unit W Control Y (0) Treatment Y (1) 
1 1 ? 14 
2 0 6 ? 
3 0 4 ? 
4 0 5 ? 
5 0 6 ? 
6 0 6 ? 
7 1 ? 10 
8 1 ? 9 
`observed' average 5.4 11 
森田(東北大) 実証分析入門演習Dec 13, 2014 14 / 28
割当メカニズムの重要性 
補完imputation による因果推論 
完璧な医者が最善を尽くしているとなると,欠損データの補完がで 
きる: 
Potential Outcomes 
Unit W Control Y (0) Treatment Y (1) 
1 1 14 14 
2 0 6 6 
3 0 4 4 
4 0 5 5 
5 0 6 6 
6 0 6 6 
7 1 10 10 
8 1 9 9 
`observed' average 7.5 7.5 
森田(東北大) 実証分析入門演習Dec 13, 2014 15 / 28
割当メカニズムの重要性 
さまざまな割当メカニズム 
assignment mechanism: 観察される潜在的結果と欠損する潜在的結 
果を振り分けるもの: 
Pr(WjX; Y (0); Y (1)) 
混同的でないunconfounded 割当メカニズム:Pr(WjX) 
確率的なprobabilistic 割当メカニズム:Pr(Wi = 1jX; Y (0); Y (1)) 
個別的なindividualistic 割当メカニズム: 
AM / ΠN 
i=1 Pr(WijXi; Yi(0); Yi(1)) 
古典的なランダム化実験: 
AM / 
ΠN 
i=1 Pr(WijXi) 
ちなみに,プロペンシティスコア(傾向スコアpropensity score): 
Pr(Wi = 1jXi) 
森田(東北大) 実証分析入門演習Dec 13, 2014 16 / 28
ランダム化:特殊な割当メカニズム 
Outline 
1 Introduction 
2 因果推論の根本問題 
3 因果推論の前提条件 
4 割当メカニズムの重要性 
5 ランダム化:特殊な割当メカニズム 
6 さまざまな因果推論の手法 
7 因果推論と構造推定 
森田(東北大) 実証分析入門演習Dec 13, 2014 17 / 28
ランダム化:特殊な割当メカニズム 
ランダム化=因果推論のもう一つの手法 
randomization =割当メカニズムを無作為なものとする(ただしX 
に依存させてもよい)ことで,treatment とcontrol とが「だいたい 
同じ」(もうちょっと言うと,共変量covariate がbalance している) 
状況に持ち込み,Yobs(1)Yobs(0) = Y (1) Y (0) となるように仕組 
む方法。基本的には,平均やメディアンなどを見る。 
最近のネット企業(典型例はfacebook: 
https://research.facebook.com/)は,ランダム化実験を実施し 
ている 
契約法・消費者法などでも,ランダム化実験の活用はどんどん増えて 
いる 
開発経済学などでも,ランダム化実験(フィールド実験)をかなり行 
うようになってきている 
けれども,社会科学においては,倫理的・法的な理由で,ランダム 
化実験を実施することができない場合がまだまだ多い 
森田(東北大) 実証分析入門演習Dec 13, 2014 18 / 28
ランダム化:特殊な割当メカニズム 
観察データの分析をランダム化実験と同じようにデザイ 
ンするには 
1 デザイン段階が完了するまで,結果データは見ないようにする 
2 意思決定者(割当メカニズムを実行している者)がどのように考え 
て割当を行っているのかについて分析し,割当に際して鍵となって 
いる共変量を取り出す 
3 この共変量が,入手できなかったり,ノイズの多いデータだったら, 
恐らくそのデータセットを使うのはあきらめて,別のデータセット 
を探した方が吉 
4 treatment/control グループが,バランスしている(=観察された共 
変量がほぼ同じような分布をしている)ようなサブグループを見つ 
け出す 
バランスしているかどうかには,分布を描いて目視してみることが 
有益 
必ずしも常に,十分なバランスが実現できるとは限らない 
この場合の推論は,当該サブグループの範囲内であることに注意 
森田(東北大) 実証分析入門演習Dec 13, 2014 19 / 28
さまざまな因果推論の手法 
Outline 
1 Introduction 
2 因果推論の根本問題 
3 因果推論の前提条件 
4 割当メカニズムの重要性 
5 ランダム化:特殊な割当メカニズム 
6 さまざまな因果推論の手法 
7 因果推論と構造推定 
森田(東北大) 実証分析入門演習Dec 13, 2014 20 / 28
さまざまな因果推論の手法 
マッチング 
ランダム化実験の基本アイデア 
treatment/control の間で,共変量にバランスがとれた状態を実現する 
それならば,treatment に属する各ユニットについて,共変量が「同 
じ」ユニットをcontrol から選び出してきて比較すれば良い: 
matching 
共変量が全く同じものをマッチング 
共変量ができるだけ近いものをマッチング 
propensity score でマッチング 
最近のビッグデータでは,かなり正確なマッチングが実現できるよ 
うになってきている 
cf. ビッグデータ関連では,EL も発展してきている(まだまだ 
applied の世界での実例はあまり見ないが...) 
森田(東北大) 実証分析入門演習Dec 13, 2014 21 / 28
さまざまな因果推論の手法 
DD/DiD 
differences-in-differences: (Y1T (1)  Y0C(1))  (Y0T (0)  Y0C(0)) 
時点Treatment Control 
時点0 Y1T (0) Y0T (0) Y1C(0) Y0C(0) 
時点1 Y1T (1) Y0T (1) Y1C(1) Y0C(1) 
Red texts are counterfactuals. 
私たちが知りたいもの:Y1T (1)  Y0T (1) 
一見,それらしそうな選択し: 
ビフォーアフター:Y1T (1)  Y0T (0) 
処置群vs コントロール群:Y1T (1)  Y0C(1) 
森田(東北大) 実証分析入門演習Dec 13, 2014 22 / 28
さまざまな因果推論の手法 
DD/DiD 
森田(東北大) 実証分析入門演習Dec 13, 2014 23 / 28
さまざまな因果推論の手法 
FE 
森田(東北大) 実証分析入門演習Dec 13, 2014 24 / 28
さまざまな因果推論の手法 
IV/LATE 
confounded な割当メカニズムについても利用可能 
natural experiment を探す:instrumental variable 
具体例(Angrist のベトナム戦争徴兵制のくじ) 
従軍経験が賃金に与える影響の測定 
ベトナム戦争時の徴兵は,くじ:ランダムな自然実験 
くじに「当選する」かどうかはランダムだが,くじに当選することに 
よって従軍確率が増加し,それによって賃金は左右される 
wrong IV とweak IV に注意 
wrong IV:「IV が従属変数に影響するのは,内生的な説明変数を通じ 
てだけ」というexclusion restriction [only through condition] が充足さ 
れない 
weak IV:IV と内生的な説明変数との相関関係が弱い 
また,IV はLATE (local average treatment effect on compliers) に過 
ぎない〔されどLATE〕 
complier = IV によって影響を受けるユニット 
森田(東北大) 実証分析入門演習Dec 13, 2014 25 / 28
さまざまな因果推論の手法 
RD 
恣意的な規制・介入が存在している場合 
その規制の近傍では,ランダム化が実現しているはず 
それであれば,近傍のデータを取り出せば,規制の有無の影響を測定 
できるはず 
具体例 
負債額に基づく規制の変化 
世帯収入に基づく社会保障給付の変化 
森田(東北大) 実証分析入門演習Dec 13, 2014 26 / 28
因果推論と構造推定 
Outline 
1 Introduction 
2 因果推論の根本問題 
3 因果推論の前提条件 
4 割当メカニズムの重要性 
5 ランダム化:特殊な割当メカニズム 
6 さまざまな因果推論の手法 
7 因果推論と構造推定 
森田(東北大) 実証分析入門演習Dec 13, 2014 27 / 28
因果推論と構造推定 
因果推論vs 構造推定 
因果推論:最小限の前提に依拠して,因果関係を推定 
伝統的な計量経済学における構造推定:世界が(経済学)モデルに 
したがって動いていると仮定した上で,モデルのパラメタを推定 
いわゆる構造方程式(SEM/structural equation model)とは違う 
両者の対立点 
internal validity vs external validity 
前提条件の明示 
経済学教育への影響 
分野の違い 
森田(東北大) 実証分析入門演習Dec 13, 2014 28 / 28

Mais conteúdo relacionado

Mais procurados

統計的因果推論 勉強用 isseing333
統計的因果推論 勉強用 isseing333統計的因果推論 勉強用 isseing333
統計的因果推論 勉強用 isseing333Issei Kurahashi
 
星野「調査観察データの統計科学」第3章
星野「調査観察データの統計科学」第3章星野「調査観察データの統計科学」第3章
星野「調査観察データの統計科学」第3章Shuyo Nakatani
 
時系列予測にTransformerを使うのは有効か?
時系列予測にTransformerを使うのは有効か?時系列予測にTransformerを使うのは有効か?
時系列予測にTransformerを使うのは有効か?Fumihiko Takahashi
 
勾配ブースティングの基礎と最新の動向 (MIRU2020 Tutorial)
勾配ブースティングの基礎と最新の動向 (MIRU2020 Tutorial)勾配ブースティングの基礎と最新の動向 (MIRU2020 Tutorial)
勾配ブースティングの基礎と最新の動向 (MIRU2020 Tutorial)RyuichiKanoh
 
機械学習モデルの判断根拠の説明
機械学習モデルの判断根拠の説明機械学習モデルの判断根拠の説明
機械学習モデルの判断根拠の説明Satoshi Hara
 
最適化超入門
最適化超入門最適化超入門
最適化超入門Takami Sato
 
バンディット問題について
バンディット問題についてバンディット問題について
バンディット問題についてjkomiyama
 
パターン認識 第10章 決定木
パターン認識 第10章 決定木 パターン認識 第10章 決定木
パターン認識 第10章 決定木 Miyoshi Yuya
 
Rで階層ベイズモデル
Rで階層ベイズモデルRで階層ベイズモデル
Rで階層ベイズモデルYohei Sato
 
「生態学における統計的因果推論」という大ネタへの挑戦:その理論的背景と適用事例
「生態学における統計的因果推論」という大ネタへの挑戦:その理論的背景と適用事例「生態学における統計的因果推論」という大ネタへの挑戦:その理論的背景と適用事例
「生態学における統計的因果推論」という大ネタへの挑戦:その理論的背景と適用事例takehikoihayashi
 
因果探索: 基本から最近の発展までを概説
因果探索: 基本から最近の発展までを概説因果探索: 基本から最近の発展までを概説
因果探索: 基本から最近の発展までを概説Shiga University, RIKEN
 
「統計的学習理論」第1章
「統計的学習理論」第1章「統計的学習理論」第1章
「統計的学習理論」第1章Kota Matsui
 
科学と機械学習のあいだ:変量の設計・変換・選択・交互作用・線形性
科学と機械学習のあいだ:変量の設計・変換・選択・交互作用・線形性科学と機械学習のあいだ:変量の設計・変換・選択・交互作用・線形性
科学と機械学習のあいだ:変量の設計・変換・選択・交互作用・線形性Ichigaku Takigawa
 
Kaggleのテクニック
KaggleのテクニックKaggleのテクニック
KaggleのテクニックYasunori Ozaki
 
相関と因果について考える:統計的因果推論、その(不)可能性の中心
相関と因果について考える:統計的因果推論、その(不)可能性の中心相関と因果について考える:統計的因果推論、その(不)可能性の中心
相関と因果について考える:統計的因果推論、その(不)可能性の中心takehikoihayashi
 
連続変量を含む条件付相互情報量の推定
連続変量を含む条件付相互情報量の推定連続変量を含む条件付相互情報量の推定
連続変量を含む条件付相互情報量の推定Joe Suzuki
 
“機械学習の説明”の信頼性
“機械学習の説明”の信頼性“機械学習の説明”の信頼性
“機械学習の説明”の信頼性Satoshi Hara
 
100614 構造方程式モデリング基本の「き」
100614 構造方程式モデリング基本の「き」100614 構造方程式モデリング基本の「き」
100614 構造方程式モデリング基本の「き」Shinohara Masahiro
 

Mais procurados (20)

統計的因果推論 勉強用 isseing333
統計的因果推論 勉強用 isseing333統計的因果推論 勉強用 isseing333
統計的因果推論 勉強用 isseing333
 
星野「調査観察データの統計科学」第3章
星野「調査観察データの統計科学」第3章星野「調査観察データの統計科学」第3章
星野「調査観察データの統計科学」第3章
 
時系列予測にTransformerを使うのは有効か?
時系列予測にTransformerを使うのは有効か?時系列予測にTransformerを使うのは有効か?
時系列予測にTransformerを使うのは有効か?
 
勾配ブースティングの基礎と最新の動向 (MIRU2020 Tutorial)
勾配ブースティングの基礎と最新の動向 (MIRU2020 Tutorial)勾配ブースティングの基礎と最新の動向 (MIRU2020 Tutorial)
勾配ブースティングの基礎と最新の動向 (MIRU2020 Tutorial)
 
機械学習モデルの判断根拠の説明
機械学習モデルの判断根拠の説明機械学習モデルの判断根拠の説明
機械学習モデルの判断根拠の説明
 
最適化超入門
最適化超入門最適化超入門
最適化超入門
 
バンディット問題について
バンディット問題についてバンディット問題について
バンディット問題について
 
パターン認識 第10章 決定木
パターン認識 第10章 決定木 パターン認識 第10章 決定木
パターン認識 第10章 決定木
 
Rで階層ベイズモデル
Rで階層ベイズモデルRで階層ベイズモデル
Rで階層ベイズモデル
 
正準相関分析
正準相関分析正準相関分析
正準相関分析
 
「生態学における統計的因果推論」という大ネタへの挑戦:その理論的背景と適用事例
「生態学における統計的因果推論」という大ネタへの挑戦:その理論的背景と適用事例「生態学における統計的因果推論」という大ネタへの挑戦:その理論的背景と適用事例
「生態学における統計的因果推論」という大ネタへの挑戦:その理論的背景と適用事例
 
因果探索: 基本から最近の発展までを概説
因果探索: 基本から最近の発展までを概説因果探索: 基本から最近の発展までを概説
因果探索: 基本から最近の発展までを概説
 
「統計的学習理論」第1章
「統計的学習理論」第1章「統計的学習理論」第1章
「統計的学習理論」第1章
 
科学と機械学習のあいだ:変量の設計・変換・選択・交互作用・線形性
科学と機械学習のあいだ:変量の設計・変換・選択・交互作用・線形性科学と機械学習のあいだ:変量の設計・変換・選択・交互作用・線形性
科学と機械学習のあいだ:変量の設計・変換・選択・交互作用・線形性
 
Kaggleのテクニック
KaggleのテクニックKaggleのテクニック
Kaggleのテクニック
 
相関と因果について考える:統計的因果推論、その(不)可能性の中心
相関と因果について考える:統計的因果推論、その(不)可能性の中心相関と因果について考える:統計的因果推論、その(不)可能性の中心
相関と因果について考える:統計的因果推論、その(不)可能性の中心
 
連続変量を含む条件付相互情報量の推定
連続変量を含む条件付相互情報量の推定連続変量を含む条件付相互情報量の推定
連続変量を含む条件付相互情報量の推定
 
一般化線形モデル (GLM) & 一般化加法モデル(GAM)
一般化線形モデル (GLM) & 一般化加法モデル(GAM) 一般化線形モデル (GLM) & 一般化加法モデル(GAM)
一般化線形モデル (GLM) & 一般化加法モデル(GAM)
 
“機械学習の説明”の信頼性
“機械学習の説明”の信頼性“機械学習の説明”の信頼性
“機械学習の説明”の信頼性
 
100614 構造方程式モデリング基本の「き」
100614 構造方程式モデリング基本の「き」100614 構造方程式モデリング基本の「き」
100614 構造方程式モデリング基本の「き」
 

Semelhante a 因果推論の基礎

明日から読めるメタ・アナリシス
明日から読めるメタ・アナリシス明日から読めるメタ・アナリシス
明日から読めるメタ・アナリシスYasuyuki Okumura
 
Fumitot ver.2.3
Fumitot ver.2.3Fumitot ver.2.3
Fumitot ver.2.3FumitoT
 
「診断精度研究のメタ分析」の入門
「診断精度研究のメタ分析」の入門「診断精度研究のメタ分析」の入門
「診断精度研究のメタ分析」の入門yokomitsuken5
 
ソフトウェアテストの再検討
ソフトウェアテストの再検討 ソフトウェアテストの再検討
ソフトウェアテストの再検討 ikedkana
 
患者報告式アウトカム尺度における 臨床的意味のある変化の定め方
患者報告式アウトカム尺度における臨床的意味のある変化の定め方患者報告式アウトカム尺度における臨床的意味のある変化の定め方
患者報告式アウトカム尺度における 臨床的意味のある変化の定め方Yasuyuki Okumura
 
ベイズ入門
ベイズ入門ベイズ入門
ベイズ入門Zansa
 
Analysis of clinical trials using sas 勉強用 isseing333
Analysis of clinical trials using sas 勉強用 isseing333Analysis of clinical trials using sas 勉強用 isseing333
Analysis of clinical trials using sas 勉強用 isseing333Issei Kurahashi
 
GRADEの基礎:概要と問題設定
GRADEの基礎:概要と問題設定GRADEの基礎:概要と問題設定
GRADEの基礎:概要と問題設定Yuko Masuzawa
 
事前登録のやり方
事前登録のやり方事前登録のやり方
事前登録のやり方Yuki Yamada
 
2014年5月21日「パーティクルフィルタの癖から知るロボットへの確率的手法の正しい適用方法」---第58回システム制御情報学会研究発表講演会チュートリアル講演
2014年5月21日「パーティクルフィルタの癖から知るロボットへの確率的手法の正しい適用方法」---第58回システム制御情報学会研究発表講演会チュートリアル講演2014年5月21日「パーティクルフィルタの癖から知るロボットへの確率的手法の正しい適用方法」---第58回システム制御情報学会研究発表講演会チュートリアル講演
2014年5月21日「パーティクルフィルタの癖から知るロボットへの確率的手法の正しい適用方法」---第58回システム制御情報学会研究発表講演会チュートリアル講演Ryuichi Ueda
 
明日から読める無作為化比較試験: 行動療法研究に求められる統計学
明日から読める無作為化比較試験: 行動療法研究に求められる統計学明日から読める無作為化比較試験: 行動療法研究に求められる統計学
明日から読める無作為化比較試験: 行動療法研究に求められる統計学Yasuyuki Okumura
 
Jcors_2021年アドベントカレンダー企画スライド
Jcors_2021年アドベントカレンダー企画スライドJcors_2021年アドベントカレンダー企画スライド
Jcors_2021年アドベントカレンダー企画スライドMasayaITO6
 
効果測定入門 Rによる傾向スコア解析
効果測定入門  Rによる傾向スコア解析効果測定入門  Rによる傾向スコア解析
効果測定入門 Rによる傾向スコア解析aa_aa_aa
 
データサイエンス概論第一=1-3 平均と分散
データサイエンス概論第一=1-3 平均と分散データサイエンス概論第一=1-3 平均と分散
データサイエンス概論第一=1-3 平均と分散Seiichi Uchida
 
理科教育学研究のための統計分析入門
理科教育学研究のための統計分析入門理科教育学研究のための統計分析入門
理科教育学研究のための統計分析入門Hiroshi Unzai
 
20170202 srws第七回統合、層別・感度分析、欠測への対処
20170202 srws第七回統合、層別・感度分析、欠測への対処20170202 srws第七回統合、層別・感度分析、欠測への対処
20170202 srws第七回統合、層別・感度分析、欠測への対処SR WS
 
20160727 srws第七回@滋賀医大統合、層別・感度分析、欠測への対処
20160727 srws第七回@滋賀医大統合、層別・感度分析、欠測への対処20160727 srws第七回@滋賀医大統合、層別・感度分析、欠測への対処
20160727 srws第七回@滋賀医大統合、層別・感度分析、欠測への対処SR WS
 
統計学における相関分析と仮説検定の基本的な考え方とその実践
統計学における相関分析と仮説検定の基本的な考え方とその実践統計学における相関分析と仮説検定の基本的な考え方とその実践
統計学における相関分析と仮説検定の基本的な考え方とその実践id774
 

Semelhante a 因果推論の基礎 (20)

Gasshuku98
Gasshuku98Gasshuku98
Gasshuku98
 
明日から読めるメタ・アナリシス
明日から読めるメタ・アナリシス明日から読めるメタ・アナリシス
明日から読めるメタ・アナリシス
 
Fumitot ver.2.3
Fumitot ver.2.3Fumitot ver.2.3
Fumitot ver.2.3
 
「診断精度研究のメタ分析」の入門
「診断精度研究のメタ分析」の入門「診断精度研究のメタ分析」の入門
「診断精度研究のメタ分析」の入門
 
ソフトウェアテストの再検討
ソフトウェアテストの再検討 ソフトウェアテストの再検討
ソフトウェアテストの再検討
 
患者報告式アウトカム尺度における 臨床的意味のある変化の定め方
患者報告式アウトカム尺度における臨床的意味のある変化の定め方患者報告式アウトカム尺度における臨床的意味のある変化の定め方
患者報告式アウトカム尺度における 臨床的意味のある変化の定め方
 
ベイズ入門
ベイズ入門ベイズ入門
ベイズ入門
 
NL20161222invited
NL20161222invitedNL20161222invited
NL20161222invited
 
Analysis of clinical trials using sas 勉強用 isseing333
Analysis of clinical trials using sas 勉強用 isseing333Analysis of clinical trials using sas 勉強用 isseing333
Analysis of clinical trials using sas 勉強用 isseing333
 
GRADEの基礎:概要と問題設定
GRADEの基礎:概要と問題設定GRADEの基礎:概要と問題設定
GRADEの基礎:概要と問題設定
 
事前登録のやり方
事前登録のやり方事前登録のやり方
事前登録のやり方
 
2014年5月21日「パーティクルフィルタの癖から知るロボットへの確率的手法の正しい適用方法」---第58回システム制御情報学会研究発表講演会チュートリアル講演
2014年5月21日「パーティクルフィルタの癖から知るロボットへの確率的手法の正しい適用方法」---第58回システム制御情報学会研究発表講演会チュートリアル講演2014年5月21日「パーティクルフィルタの癖から知るロボットへの確率的手法の正しい適用方法」---第58回システム制御情報学会研究発表講演会チュートリアル講演
2014年5月21日「パーティクルフィルタの癖から知るロボットへの確率的手法の正しい適用方法」---第58回システム制御情報学会研究発表講演会チュートリアル講演
 
明日から読める無作為化比較試験: 行動療法研究に求められる統計学
明日から読める無作為化比較試験: 行動療法研究に求められる統計学明日から読める無作為化比較試験: 行動療法研究に求められる統計学
明日から読める無作為化比較試験: 行動療法研究に求められる統計学
 
Jcors_2021年アドベントカレンダー企画スライド
Jcors_2021年アドベントカレンダー企画スライドJcors_2021年アドベントカレンダー企画スライド
Jcors_2021年アドベントカレンダー企画スライド
 
効果測定入門 Rによる傾向スコア解析
効果測定入門  Rによる傾向スコア解析効果測定入門  Rによる傾向スコア解析
効果測定入門 Rによる傾向スコア解析
 
データサイエンス概論第一=1-3 平均と分散
データサイエンス概論第一=1-3 平均と分散データサイエンス概論第一=1-3 平均と分散
データサイエンス概論第一=1-3 平均と分散
 
理科教育学研究のための統計分析入門
理科教育学研究のための統計分析入門理科教育学研究のための統計分析入門
理科教育学研究のための統計分析入門
 
20170202 srws第七回統合、層別・感度分析、欠測への対処
20170202 srws第七回統合、層別・感度分析、欠測への対処20170202 srws第七回統合、層別・感度分析、欠測への対処
20170202 srws第七回統合、層別・感度分析、欠測への対処
 
20160727 srws第七回@滋賀医大統合、層別・感度分析、欠測への対処
20160727 srws第七回@滋賀医大統合、層別・感度分析、欠測への対処20160727 srws第七回@滋賀医大統合、層別・感度分析、欠測への対処
20160727 srws第七回@滋賀医大統合、層別・感度分析、欠測への対処
 
統計学における相関分析と仮説検定の基本的な考え方とその実践
統計学における相関分析と仮説検定の基本的な考え方とその実践統計学における相関分析と仮説検定の基本的な考え方とその実践
統計学における相関分析と仮説検定の基本的な考え方とその実践
 

因果推論の基礎

  • 1. 因果推論の基礎 ――ミクロ計量経済学の最近の潮流から―― 森田果y hatsuru@law.tohoku.ac.jp y 東北大学大学院法学研究科 法社会学会関東研究支部定例研究会(早稲田大学) 2014 年12 月13 日 森田(東北大) 実証分析入門演習Dec 13, 2014 1 / 28
  • 2. Introduction Outline 1 Introduction 2 因果推論の根本問題 3 因果推論の前提条件 4 割当メカニズムの重要性 5 ランダム化:特殊な割当メカニズム 6 さまざまな因果推論の手法 7 因果推論と構造推定 森田(東北大) 実証分析入門演習Dec 13, 2014 2 / 28
  • 3. Introduction 伝統的な法学における実証分析の利用 記述的推論 データを要約統計量(summary statistics)・記述統計量(descritive statistics) の形にまとめる mean, median, maximum/minimum, variance など これだけでも,〔上手に行えば――King et al 1994〕分かることは結構 ある 相関関係(correlation, association) の計算 基本的にはOLS(最小二乗法による線形回帰)やクロス集計 差の検定 e.g., 男女(の平均賃金etc)の間に有意な差があるかどうかの検定 森田(東北大) 実証分析入門演習Dec 13, 2014 3 / 28
  • 4. Introduction 最近の法学研究における実証分析の利用 より政策的な方向へ consequentialism | 法ルールがその目的を達成できているかどうか? program evaluation と呼ばれる分野との接合 単なる記述的推論ではなく,因果推論(causal inference)の重視 相関関係ではなく,因果関係の評価 経済学や政治学でのトレンドを反映 医療でのEBM なども因果推論の世界(統計学の世界では裏でつな がっている) 因果推論では,推定手法(統計ソフトウェアが計算してくれる部分) よりも,リサーチデザイン(どこに因果関係を見いだすか,うまく 仕組む)ことの方が重要 森田(東北大) 実証分析入門演習Dec 13, 2014 4 / 28
  • 5. 因果推論の根本問題 Outline 1 Introduction 2 因果推論の根本問題 3 因果推論の前提条件 4 割当メカニズムの重要性 5 ランダム化:特殊な割当メカニズム 6 さまざまな因果推論の手法 7 因果推論と構造推定 森田(東北大) 実証分析入門演習Dec 13, 2014 5 / 28
  • 6. 因果推論の根本問題 基本概念 a la RCM (Rubin Causal Model) unit: 対象 treatment: 介入がなかった場合(=control)と比較して,それが あった場合の効果を測定したいと考えている(政策)介入 potential outcomes: ユニットにtreatment があった場合となかった 場合について,ユニットが取り得る(=まだ観察されていないもの である点に注意!)値 counterfactual: 実現しなかった方のpotential outcome causal effect: 1 つ1 つのユニットについて,treatment があった場合 のpotential outcome とtreatment がなかった場合のpotential outcome との間の差 `The Fundamental Problem of Causal Inference': 私たちは,複数の potential outcome のうち,最大で1 個しか観察することはできない から,causal effect を直接観察することはできない 森田(東北大) 実証分析入門演習Dec 13, 2014 6 / 28
  • 7. 因果推論の根本問題 具体例:単純な差分をとる場合 ユニット=ある時点の「私」。頭痛がある。 treatment =頭痛薬アスピリンの投与。 Y = 2 時間後の「私」の頭痛の評価。treatment の有無で,2 通りあ り得る。 Unit 当初の頭痛potential outcomes Y へのcausal effect X Y (Asp) Y (Not) Y (Asp) Y (Not) 「私」80 25 75 -50 森田(東北大) 実証分析入門演習Dec 13, 2014 7 / 28
  • 8. 因果推論の前提条件 Outline 1 Introduction 2 因果推論の根本問題 3 因果推論の前提条件 4 割当メカニズムの重要性 5 ランダム化:特殊な割当メカニズム 6 さまざまな因果推論の手法 7 因果推論と構造推定 森田(東北大) 実証分析入門演習Dec 13, 2014 8 / 28
  • 9. 因果推論の前提条件 基本概念:因果推論のための前提条件 replication: 少なくとも1 つのユニットはtreatment を受け,少なく とも1 つのユニットはtreatment を受けない(control)。複数の対象 の間のvariation でもいいし,単一の対象が異なる時点でvariation が あってもよい。 SUTVA (stable unit-treatment-value assumption):2 つの内容がある a) 1 つ1 つのユニットについて,同時で1 つのtreatment しか働かず, control も1 種類しかない b) ユニット間に干渉がない(spill over effect や一般均衡効果は存在し ない) assignment mechanism: どのユニットがtreatment を受け,どのユ ニットがcontrol になるかを決定するメカニズム 森田(東北大) 実証分析入門演習Dec 13, 2014 9 / 28
  • 10. 因果推論の前提条件 Nユニット・処置2 つで,SUTVA が満たされるケース Unit X Y (1) Y (0) ユニットレベルの因果効果 1 X1 Y1(1) Y1(0) Y1(1) Y1(0) 2 X2 Y2(1) Y2(0) Y2(1) Y2(0) ... ... ... ... ... i Xi Yi(1) Yi(0) Yi(1) Yi(0) ... ... ... ... ... N XN YN(1) YN(0) YN(1) YN(0) 森田(東北大) 実証分析入門演習Dec 13, 2014 10 / 28
  • 11. 因果推論の前提条件 population level の因果効果 Yi(1) とYi(0) を比較するのが基本 ただし,このようなユニットレベル因果効果を直接観察することは不 可能なので,代わりに... 1 と0 との間の平均因果効果average causal effect Ave[Yi(1) Yi(0)] = 1 N ΣN i=1(Yi(1) Yi(0)) 1 と0 との間のメディアン因果効果 Median[Yi(1) Yi(0)] などなど... を推定していくことになる 森田(東北大) 実証分析入門演習Dec 13, 2014 11 / 28
  • 12. 割当メカニズムの重要性 Outline 1 Introduction 2 因果推論の根本問題 3 因果推論の前提条件 4 割当メカニズムの重要性 5 ランダム化:特殊な割当メカニズム 6 さまざまな因果推論の手法 7 因果推論と構造推定 森田(東北大) 実証分析入門演習Dec 13, 2014 12 / 28
  • 13. 割当メカニズムの重要性 割当メカニズム 具体例=完璧な医者 Potential Outcomes Unit Control Y (0) Treatment Y (1) 1 13 14 2 6 0 3 4 1 4 5 2 5 6 3 6 6 1 7 8 10 8 8 9 `true' average 7 5 average causal effect = -2 森田(東北大) 実証分析入門演習Dec 13, 2014 13 / 28
  • 14. 割当メカニズムの重要性 割当メカニズム 完璧な医者が,一人一人について最適な治療方法を適用すると: W は,treatment のあり(1) なし(0) を示す Potential Outcomes Unit W Control Y (0) Treatment Y (1) 1 1 ? 14 2 0 6 ? 3 0 4 ? 4 0 5 ? 5 0 6 ? 6 0 6 ? 7 1 ? 10 8 1 ? 9 `observed' average 5.4 11 森田(東北大) 実証分析入門演習Dec 13, 2014 14 / 28
  • 15. 割当メカニズムの重要性 補完imputation による因果推論 完璧な医者が最善を尽くしているとなると,欠損データの補完がで きる: Potential Outcomes Unit W Control Y (0) Treatment Y (1) 1 1 14 14 2 0 6 6 3 0 4 4 4 0 5 5 5 0 6 6 6 0 6 6 7 1 10 10 8 1 9 9 `observed' average 7.5 7.5 森田(東北大) 実証分析入門演習Dec 13, 2014 15 / 28
  • 16. 割当メカニズムの重要性 さまざまな割当メカニズム assignment mechanism: 観察される潜在的結果と欠損する潜在的結 果を振り分けるもの: Pr(WjX; Y (0); Y (1)) 混同的でないunconfounded 割当メカニズム:Pr(WjX) 確率的なprobabilistic 割当メカニズム:Pr(Wi = 1jX; Y (0); Y (1)) 個別的なindividualistic 割当メカニズム: AM / ΠN i=1 Pr(WijXi; Yi(0); Yi(1)) 古典的なランダム化実験: AM / ΠN i=1 Pr(WijXi) ちなみに,プロペンシティスコア(傾向スコアpropensity score): Pr(Wi = 1jXi) 森田(東北大) 実証分析入門演習Dec 13, 2014 16 / 28
  • 17. ランダム化:特殊な割当メカニズム Outline 1 Introduction 2 因果推論の根本問題 3 因果推論の前提条件 4 割当メカニズムの重要性 5 ランダム化:特殊な割当メカニズム 6 さまざまな因果推論の手法 7 因果推論と構造推定 森田(東北大) 実証分析入門演習Dec 13, 2014 17 / 28
  • 18. ランダム化:特殊な割当メカニズム ランダム化=因果推論のもう一つの手法 randomization =割当メカニズムを無作為なものとする(ただしX に依存させてもよい)ことで,treatment とcontrol とが「だいたい 同じ」(もうちょっと言うと,共変量covariate がbalance している) 状況に持ち込み,Yobs(1)Yobs(0) = Y (1) Y (0) となるように仕組 む方法。基本的には,平均やメディアンなどを見る。 最近のネット企業(典型例はfacebook: https://research.facebook.com/)は,ランダム化実験を実施し ている 契約法・消費者法などでも,ランダム化実験の活用はどんどん増えて いる 開発経済学などでも,ランダム化実験(フィールド実験)をかなり行 うようになってきている けれども,社会科学においては,倫理的・法的な理由で,ランダム 化実験を実施することができない場合がまだまだ多い 森田(東北大) 実証分析入門演習Dec 13, 2014 18 / 28
  • 19. ランダム化:特殊な割当メカニズム 観察データの分析をランダム化実験と同じようにデザイ ンするには 1 デザイン段階が完了するまで,結果データは見ないようにする 2 意思決定者(割当メカニズムを実行している者)がどのように考え て割当を行っているのかについて分析し,割当に際して鍵となって いる共変量を取り出す 3 この共変量が,入手できなかったり,ノイズの多いデータだったら, 恐らくそのデータセットを使うのはあきらめて,別のデータセット を探した方が吉 4 treatment/control グループが,バランスしている(=観察された共 変量がほぼ同じような分布をしている)ようなサブグループを見つ け出す バランスしているかどうかには,分布を描いて目視してみることが 有益 必ずしも常に,十分なバランスが実現できるとは限らない この場合の推論は,当該サブグループの範囲内であることに注意 森田(東北大) 実証分析入門演習Dec 13, 2014 19 / 28
  • 20. さまざまな因果推論の手法 Outline 1 Introduction 2 因果推論の根本問題 3 因果推論の前提条件 4 割当メカニズムの重要性 5 ランダム化:特殊な割当メカニズム 6 さまざまな因果推論の手法 7 因果推論と構造推定 森田(東北大) 実証分析入門演習Dec 13, 2014 20 / 28
  • 21. さまざまな因果推論の手法 マッチング ランダム化実験の基本アイデア treatment/control の間で,共変量にバランスがとれた状態を実現する それならば,treatment に属する各ユニットについて,共変量が「同 じ」ユニットをcontrol から選び出してきて比較すれば良い: matching 共変量が全く同じものをマッチング 共変量ができるだけ近いものをマッチング propensity score でマッチング 最近のビッグデータでは,かなり正確なマッチングが実現できるよ うになってきている cf. ビッグデータ関連では,EL も発展してきている(まだまだ applied の世界での実例はあまり見ないが...) 森田(東北大) 実証分析入門演習Dec 13, 2014 21 / 28
  • 22. さまざまな因果推論の手法 DD/DiD differences-in-differences: (Y1T (1) Y0C(1)) (Y0T (0) Y0C(0)) 時点Treatment Control 時点0 Y1T (0) Y0T (0) Y1C(0) Y0C(0) 時点1 Y1T (1) Y0T (1) Y1C(1) Y0C(1) Red texts are counterfactuals. 私たちが知りたいもの:Y1T (1) Y0T (1) 一見,それらしそうな選択し: ビフォーアフター:Y1T (1) Y0T (0) 処置群vs コントロール群:Y1T (1) Y0C(1) 森田(東北大) 実証分析入門演習Dec 13, 2014 22 / 28
  • 23. さまざまな因果推論の手法 DD/DiD 森田(東北大) 実証分析入門演習Dec 13, 2014 23 / 28
  • 24. さまざまな因果推論の手法 FE 森田(東北大) 実証分析入門演習Dec 13, 2014 24 / 28
  • 25. さまざまな因果推論の手法 IV/LATE confounded な割当メカニズムについても利用可能 natural experiment を探す:instrumental variable 具体例(Angrist のベトナム戦争徴兵制のくじ) 従軍経験が賃金に与える影響の測定 ベトナム戦争時の徴兵は,くじ:ランダムな自然実験 くじに「当選する」かどうかはランダムだが,くじに当選することに よって従軍確率が増加し,それによって賃金は左右される wrong IV とweak IV に注意 wrong IV:「IV が従属変数に影響するのは,内生的な説明変数を通じ てだけ」というexclusion restriction [only through condition] が充足さ れない weak IV:IV と内生的な説明変数との相関関係が弱い また,IV はLATE (local average treatment effect on compliers) に過 ぎない〔されどLATE〕 complier = IV によって影響を受けるユニット 森田(東北大) 実証分析入門演習Dec 13, 2014 25 / 28
  • 26. さまざまな因果推論の手法 RD 恣意的な規制・介入が存在している場合 その規制の近傍では,ランダム化が実現しているはず それであれば,近傍のデータを取り出せば,規制の有無の影響を測定 できるはず 具体例 負債額に基づく規制の変化 世帯収入に基づく社会保障給付の変化 森田(東北大) 実証分析入門演習Dec 13, 2014 26 / 28
  • 27. 因果推論と構造推定 Outline 1 Introduction 2 因果推論の根本問題 3 因果推論の前提条件 4 割当メカニズムの重要性 5 ランダム化:特殊な割当メカニズム 6 さまざまな因果推論の手法 7 因果推論と構造推定 森田(東北大) 実証分析入門演習Dec 13, 2014 27 / 28
  • 28. 因果推論と構造推定 因果推論vs 構造推定 因果推論:最小限の前提に依拠して,因果関係を推定 伝統的な計量経済学における構造推定:世界が(経済学)モデルに したがって動いていると仮定した上で,モデルのパラメタを推定 いわゆる構造方程式(SEM/structural equation model)とは違う 両者の対立点 internal validity vs external validity 前提条件の明示 経済学教育への影響 分野の違い 森田(東北大) 実証分析入門演習Dec 13, 2014 28 / 28