SlideShare uma empresa Scribd logo
1 de 21
25th July, 2014
Atsushi Shiraishi, MD
Trauma and Emergency Medical Center,
Tokyo Medical and Dental University
データ欠損があったらどうなるか
• 配布した “PSM2.R”をエディタで開いて下さい
• 丸ごとRのコンソールに貼り付け、リターンを
押して実行して下さい。
• オリジナルデータセットでのPSMと、ランダム
に10%の欠損値を作ったデータセットでの
PSMを出力します。
After PSM (欠損値なし)
Stratified by treat
0 1 p test
n 150 150
age (mean (sd)) 25.41 (6.86) 25.48 (7.29) 0.929
educ (mean (sd)) 10.11 (1.67) 10.29 (1.77) 0.349
black (mean (sd)) 0.87 (0.33) 0.87 (0.34) 0.864
hisp (mean (sd)) 0.05 (0.23) 0.06 (0.24) 0.804
married (mean (sd)) 0.18 (0.39) 0.16 (0.37) 0.646
nodegr (mean (sd)) 0.81 (0.40) 0.77 (0.42) 0.399
re74 (mean (sd)) 1821.88 (4792.12) 1517.04 (4370.13) 0.565
re75 (mean (sd)) 1329.82 (3350.84) 914.13 (1943.45) 0.190
re78 (mean (sd)) 4064.76 (4568.86) 6149.53 (7960.04) 0.006
u74 (mean (sd)) 0.76 (0.43) 0.78 (0.42) 0.682
u75 (mean (sd)) 0.68 (0.47) 0.68 (0.47) 1.000
After PSM (欠損値あり)
Stratified by treat
0 1 p test
n 36 36
age (mean (sd)) 24.69 (4.60) 24.94 (6.37) 0.849
educ (mean (sd)) 10.44 (1.40) 10.22 (1.91) 0.576
black (mean (sd)) 0.86 (0.35) 0.83 (0.38) 0.747
hisp (mean (sd)) 0.06 (0.23) 0.08 (0.28) 0.649
married (mean (sd)) 0.14 (0.35) 0.11 (0.32) 0.726
nodegr (mean (sd)) 0.78 (0.42) 0.72 (0.45) 0.592
re74 (mean (sd)) 2525.86 (6186.79) 1184.89 (3236.43) 0.253
re75 (mean (sd)) 1160.82 (3337.37) 761.30 (1286.41) 0.505
re78 (mean (sd)) 4705.77 (5523.46) 6854.06 (10779.25) 0.291
u74 (mean (sd)) 0.72 (0.45) 0.78 (0.42) 0.592
u75 (mean (sd)) 0.69 (0.47) 0.64 (0.49) 0.623
Rubin’s causal modelMultiple imputationも私が開
発しました。
Donald Rubin (b 1943)
Multiple imputation
欠損値を代入したデータセットを複数作成
し、その結果を統合することで欠損値デー
タの統計的推測を行う方法である (Rubin
1987)。
SeqID Gender Age Severity Year Treat Outcome
1 M 66 4 2007 NA Good
2 F 72 9 2006 No Poor
3 M NA 12 2010 Yes NA
4 F 57 19 2014 Yes Poor
5 F 29 8 2007 Yes Good
… … … … … … …
154 F 84 21 NA No Poor
155 M 75 NA 2011 Yes Good
… … … … … … …
Multiple imputation
SeqID Gender Age Severity Year Treat Outcome
1 M 66 4 2007 NA Good
2 F 72 9 2006 No Poor
3 M NA 12 2010 Yes NA
4 F 57 19 2014 Yes Poor
5 F 29 8 2007 Yes Good
… … … … … … …
154 F 84 21 NA No Poor
155 M 75 NA 2011 Yes Good
… … … … … … …
Multiple imputation
SeqID Gender Age Severity Year Treat Outcome
1 M 66 4 2007 NA Good
2 F 72 9 2006 No Poor
3 M NA 12 2010 Yes NA
4 F 57 19 2014 Yes Poor
5 F 29 8 2007 Yes Good
… … … … … … …
154 F 84 21 NA No Poor
155 M 75 NA 2011 Yes Good
… … … … … … …
分布に応じて、データセット数
の値を乱数的に発生させる
重回帰分析などを用
いて、値を予測する
Multiple imputation
Multiple imputation
欠損値を含む
データセット
データセット
1
データセット
2
データセット
m
…
データセット
1
データセット
2
データセット
m
…
統合された
解析結果
Multiple imputation
欠損値を含む
データセット
データセット
1
データセット
2
データセット
m
…
データセット
1
データセット
2
データセット
m
…
統合された
解析結果
m個の補完済み
データセットを生成
Multiple imputation
欠損値を含む
データセット
データセット
1
データセット
2
データセット
m
…
データセット
1
データセット
2
データセット
m
…
統合された
解析結果
m個の補完済み
データセットを生成
任意の統計解析
Multiple imputation
欠損値を含む
データセット
データセット
1
データセット
2
データセット
m
…
データセット
1
データセット
2
データセット
m
…
統合された
解析結果
m個の補完済み
データセットを生成
任意の統計解析
得られた統計量を
統合(単純平均)
Multiple imputation
欠損値を含む
データセット
データセット
1
データセット
2
データセット
m
…
データセット
1
データセット
2
データセット
m
…
統合された
解析結果
m個の補完済み
データセットを生成
得られた統計量を
統合(単純平均)
PSMの場合
PSを先に平均し
マッチングを行い
統計解析を行う任意の統計解析
MI+PSMもやってみましょう
• 配布した “PSM3.R”をエディタで開いて下さい
• 丸ごとRのコンソールに貼り付け、リターンを押して
実行して下さい。
• 以下のPSMを行います。
– オリジナルデータセットでのPSM
– ランダムに10%の欠損値を作ったデータセットで
のPSM
– 欠損値を多重補完したデータセットでのPSM
After PSM (欠損値なし)
Stratified by treat
0 1 p test
n 150 150
age (mean (sd)) 25.41 (6.86) 25.48 (7.29) 0.929
educ (mean (sd)) 10.11 (1.67) 10.29 (1.77) 0.349
black (mean (sd)) 0.87 (0.33) 0.87 (0.34) 0.864
hisp (mean (sd)) 0.05 (0.23) 0.06 (0.24) 0.804
married (mean (sd)) 0.18 (0.39) 0.16 (0.37) 0.646
nodegr (mean (sd)) 0.81 (0.40) 0.77 (0.42) 0.399
re74 (mean (sd)) 1821.88 (4792.12) 1517.04 (4370.13) 0.565
re75 (mean (sd)) 1329.82 (3350.84) 914.13 (1943.45) 0.190
re78 (mean (sd)) 4064.76 (4568.86) 6149.53 (7960.04) 0.006
u74 (mean (sd)) 0.76 (0.43) 0.78 (0.42) 0.682
u75 (mean (sd)) 0.68 (0.47) 0.68 (0.47) 1.000
After PSM (欠損値有り)
Stratified by treat
0 1 p test
n 36 36
age (mean (sd)) 24.69 (4.60) 24.94 (6.37) 0.849
educ (mean (sd)) 10.44 (1.40) 10.22 (1.91) 0.576
black (mean (sd)) 0.86 (0.35) 0.83 (0.38) 0.747
hisp (mean (sd)) 0.06 (0.23) 0.08 (0.28) 0.649
married (mean (sd)) 0.14 (0.35) 0.11 (0.32) 0.726
nodegr (mean (sd)) 0.78 (0.42) 0.72 (0.45) 0.592
re74 (mean (sd)) 2525.86 (6186.79) 1184.89 (3236.43) 0.253
re75 (mean (sd)) 1160.82 (3337.37) 761.30 (1286.41) 0.505
re78 (mean (sd)) 4705.77 (5523.46) 6854.06 (10779.25) 0.291
u74 (mean (sd)) 0.72 (0.45) 0.78 (0.42) 0.592
u75 (mean (sd)) 0.69 (0.47) 0.64 (0.49) 0.623
After MI+PSM
Stratified by treat
0 1 p test
n 139 139
age (mean (sd)) 25.58 (6.61) 26.02 (7.11) 0.588
educ (mean (sd)) 10.29 (1.70) 10.22 (1.94) 0.767
black (mean (sd)) 0.87 (0.34) 0.91 (0.29) 0.343
hisp (mean (sd)) 0.05 (0.22) 0.05 (0.22) 1.000
married (mean (sd)) 0.19 (0.39) 0.19 (0.39) 1.000
nodegr (mean (sd)) 0.76 (0.43) 0.76 (0.43) 1.000
re74 (mean (sd)) 1500.88 (4143.39) 1443.69 (3509.35) 0.901
re75 (mean (sd)) 1068.95 (2424.18) 1021.02 (1941.02) 0.856
re78 (mean (sd)) 3886.44 (4330.99) 5724.39 (7367.12) 0.012
u74 (mean (sd)) 0.79 (0.41) 0.77 (0.42) 0.665
u75 (mean (sd)) 0.70 (0.46) 0.66 (0.47) 0.522
Multiple imputation
利点
• 一部の欠損値のために多数の非欠損値を捨てるバイアス
を回避できる。
• 統計学的検出力を高める。
• 従来の補完法と比較して、欠損値による推定の不確定さ
を結果に反映させることができる。
Multiple imputation
欠点
• 欠損値を最小化するようデザインするのが本質です。
• 現時点でreporting guidelineが存在しない。
• バイアスを大きくするのか小さくするのか、まだ議論がある。
• 計算時間が長く、大きなデータセットでは計算不能になる。
Propensity score matching after
multiple imputation
• 後ろ向きデータで因果関係に言及できる方法です。
• ビッグデータ推奨。
• ランダム化試験より低コストで倫理審査の壁が低くランダム化
が不可能な介入の解析もできます。
• バイアスは小さくできると信じられています。
• PSMの検出力は高くないが、MIと組み合わせることでその低
下を限ることができます。

Mais conteúdo relacionado

Mais procurados

ロジスティック回帰分析の入門 -予測モデル構築-
ロジスティック回帰分析の入門 -予測モデル構築-ロジスティック回帰分析の入門 -予測モデル構築-
ロジスティック回帰分析の入門 -予測モデル構築-Koichiro Gibo
 
分割時系列解析(ITS)の入門
分割時系列解析(ITS)の入門分割時系列解析(ITS)の入門
分割時系列解析(ITS)の入門Koichiro Gibo
 
STARD2015に学ぶ「診断精度の分析」の書き方
 STARD2015に学ぶ「診断精度の分析」の書き方 STARD2015に学ぶ「診断精度の分析」の書き方
STARD2015に学ぶ「診断精度の分析」の書き方Yoshitake Takebayashi
 
質的変数の相関・因子分析
質的変数の相関・因子分析質的変数の相関・因子分析
質的変数の相関・因子分析Mitsuo Shimohata
 
比例ハザードモデルはとってもtricky!
比例ハザードモデルはとってもtricky!比例ハザードモデルはとってもtricky!
比例ハザードモデルはとってもtricky!takehikoihayashi
 
統計的検定と例数設計の基礎
統計的検定と例数設計の基礎統計的検定と例数設計の基礎
統計的検定と例数設計の基礎Senshu University
 
明日から読めるメタ・アナリシス
明日から読めるメタ・アナリシス明日から読めるメタ・アナリシス
明日から読めるメタ・アナリシスYasuyuki Okumura
 
相関と因果について考える:統計的因果推論、その(不)可能性の中心
相関と因果について考える:統計的因果推論、その(不)可能性の中心相関と因果について考える:統計的因果推論、その(不)可能性の中心
相関と因果について考える:統計的因果推論、その(不)可能性の中心takehikoihayashi
 
傾向スコア:その概念とRによる実装
傾向スコア:その概念とRによる実装傾向スコア:その概念とRによる実装
傾向スコア:その概念とRによる実装takehikoihayashi
 
201707srws第六回その2メタアナリシス・異質性・出版バイアス
201707srws第六回その2メタアナリシス・異質性・出版バイアス201707srws第六回その2メタアナリシス・異質性・出版バイアス
201707srws第六回その2メタアナリシス・異質性・出版バイアスSR WS
 
20171112予測指標の作り方セミナー事前学習
20171112予測指標の作り方セミナー事前学習20171112予測指標の作り方セミナー事前学習
20171112予測指標の作り方セミナー事前学習SR WS
 
単一事例研究法と統計的推測:ベイズ流アプローチを架け橋として (文字飛び回避版はこちら -> https://www.slideshare.net/yos...
単一事例研究法と統計的推測:ベイズ流アプローチを架け橋として (文字飛び回避版はこちら -> https://www.slideshare.net/yos...単一事例研究法と統計的推測:ベイズ流アプローチを架け橋として (文字飛び回避版はこちら -> https://www.slideshare.net/yos...
単一事例研究法と統計的推測:ベイズ流アプローチを架け橋として (文字飛び回避版はこちら -> https://www.slideshare.net/yos...Yoshitake Takebayashi
 
効果測定入門 Rによる傾向スコア解析
効果測定入門  Rによる傾向スコア解析効果測定入門  Rによる傾向スコア解析
効果測定入門 Rによる傾向スコア解析aa_aa_aa
 
ロジスティック回帰分析の書き方
ロジスティック回帰分析の書き方ロジスティック回帰分析の書き方
ロジスティック回帰分析の書き方Sayuri Shimizu
 
第4回DARM勉強会 (多母集団同時分析)
第4回DARM勉強会 (多母集団同時分析)第4回DARM勉強会 (多母集団同時分析)
第4回DARM勉強会 (多母集団同時分析)Masaru Tokuoka
 
「傾向スコア分析」 報告事例
「傾向スコア分析」 報告事例「傾向スコア分析」 報告事例
「傾向スコア分析」 報告事例Sayuri Shimizu
 
GEE(一般化推定方程式)の理論
GEE(一般化推定方程式)の理論GEE(一般化推定方程式)の理論
GEE(一般化推定方程式)の理論Koichiro Gibo
 
生存時間分析数理の基礎
生存時間分析数理の基礎生存時間分析数理の基礎
生存時間分析数理の基礎Koichiro Gibo
 
混合モデルを使って反復測定分散分析をする
混合モデルを使って反復測定分散分析をする混合モデルを使って反復測定分散分析をする
混合モデルを使って反復測定分散分析をするMasaru Tokuoka
 

Mais procurados (20)

ロジスティック回帰分析の入門 -予測モデル構築-
ロジスティック回帰分析の入門 -予測モデル構築-ロジスティック回帰分析の入門 -予測モデル構築-
ロジスティック回帰分析の入門 -予測モデル構築-
 
分割時系列解析(ITS)の入門
分割時系列解析(ITS)の入門分割時系列解析(ITS)の入門
分割時系列解析(ITS)の入門
 
STARD2015に学ぶ「診断精度の分析」の書き方
 STARD2015に学ぶ「診断精度の分析」の書き方 STARD2015に学ぶ「診断精度の分析」の書き方
STARD2015に学ぶ「診断精度の分析」の書き方
 
質的変数の相関・因子分析
質的変数の相関・因子分析質的変数の相関・因子分析
質的変数の相関・因子分析
 
比例ハザードモデルはとってもtricky!
比例ハザードモデルはとってもtricky!比例ハザードモデルはとってもtricky!
比例ハザードモデルはとってもtricky!
 
統計的検定と例数設計の基礎
統計的検定と例数設計の基礎統計的検定と例数設計の基礎
統計的検定と例数設計の基礎
 
明日から読めるメタ・アナリシス
明日から読めるメタ・アナリシス明日から読めるメタ・アナリシス
明日から読めるメタ・アナリシス
 
相関と因果について考える:統計的因果推論、その(不)可能性の中心
相関と因果について考える:統計的因果推論、その(不)可能性の中心相関と因果について考える:統計的因果推論、その(不)可能性の中心
相関と因果について考える:統計的因果推論、その(不)可能性の中心
 
傾向スコア:その概念とRによる実装
傾向スコア:その概念とRによる実装傾向スコア:その概念とRによる実装
傾向スコア:その概念とRによる実装
 
201707srws第六回その2メタアナリシス・異質性・出版バイアス
201707srws第六回その2メタアナリシス・異質性・出版バイアス201707srws第六回その2メタアナリシス・異質性・出版バイアス
201707srws第六回その2メタアナリシス・異質性・出版バイアス
 
観察研究の質の評価
観察研究の質の評価観察研究の質の評価
観察研究の質の評価
 
20171112予測指標の作り方セミナー事前学習
20171112予測指標の作り方セミナー事前学習20171112予測指標の作り方セミナー事前学習
20171112予測指標の作り方セミナー事前学習
 
単一事例研究法と統計的推測:ベイズ流アプローチを架け橋として (文字飛び回避版はこちら -> https://www.slideshare.net/yos...
単一事例研究法と統計的推測:ベイズ流アプローチを架け橋として (文字飛び回避版はこちら -> https://www.slideshare.net/yos...単一事例研究法と統計的推測:ベイズ流アプローチを架け橋として (文字飛び回避版はこちら -> https://www.slideshare.net/yos...
単一事例研究法と統計的推測:ベイズ流アプローチを架け橋として (文字飛び回避版はこちら -> https://www.slideshare.net/yos...
 
効果測定入門 Rによる傾向スコア解析
効果測定入門  Rによる傾向スコア解析効果測定入門  Rによる傾向スコア解析
効果測定入門 Rによる傾向スコア解析
 
ロジスティック回帰分析の書き方
ロジスティック回帰分析の書き方ロジスティック回帰分析の書き方
ロジスティック回帰分析の書き方
 
第4回DARM勉強会 (多母集団同時分析)
第4回DARM勉強会 (多母集団同時分析)第4回DARM勉強会 (多母集団同時分析)
第4回DARM勉強会 (多母集団同時分析)
 
「傾向スコア分析」 報告事例
「傾向スコア分析」 報告事例「傾向スコア分析」 報告事例
「傾向スコア分析」 報告事例
 
GEE(一般化推定方程式)の理論
GEE(一般化推定方程式)の理論GEE(一般化推定方程式)の理論
GEE(一般化推定方程式)の理論
 
生存時間分析数理の基礎
生存時間分析数理の基礎生存時間分析数理の基礎
生存時間分析数理の基礎
 
混合モデルを使って反復測定分散分析をする
混合モデルを使って反復測定分散分析をする混合モデルを使って反復測定分散分析をする
混合モデルを使って反復測定分散分析をする
 

Destaque

Rで学ぶ 傾向スコア解析入門 - 無作為割り当てが出来ない時の因果効果推定 -
Rで学ぶ 傾向スコア解析入門 - 無作為割り当てが出来ない時の因果効果推定 -Rで学ぶ 傾向スコア解析入門 - 無作為割り当てが出来ない時の因果効果推定 -
Rで学ぶ 傾向スコア解析入門 - 無作為割り当てが出来ない時の因果効果推定 -Yohei Sato
 
Tokyo r #37 Rubin's Rule
Tokyo r #37 Rubin's RuleTokyo r #37 Rubin's Rule
Tokyo r #37 Rubin's RuleHiroki Matsui
 
JAAM FORECAST study (Trauma) in Japanese
JAAM FORECAST study (Trauma) in JapaneseJAAM FORECAST study (Trauma) in Japanese
JAAM FORECAST study (Trauma) in JapaneseAtsushi Shiraishi
 
整形外科プライマリーケア 創の処置
整形外科プライマリーケア 創の処置整形外科プライマリーケア 創の処置
整形外科プライマリーケア 創の処置gamitake ikuiku
 
有意性と効果量について しっかり考えてみよう
有意性と効果量について しっかり考えてみよう有意性と効果量について しっかり考えてみよう
有意性と効果量について しっかり考えてみようKen Urano
 
エクセルで統計分析 統計プログラムHADについて
エクセルで統計分析 統計プログラムHADについてエクセルで統計分析 統計プログラムHADについて
エクセルで統計分析 統計プログラムHADについてHiroshi Shimizu
 

Destaque (10)

Rで学ぶ 傾向スコア解析入門 - 無作為割り当てが出来ない時の因果効果推定 -
Rで学ぶ 傾向スコア解析入門 - 無作為割り当てが出来ない時の因果効果推定 -Rで学ぶ 傾向スコア解析入門 - 無作為割り当てが出来ない時の因果効果推定 -
Rで学ぶ 傾向スコア解析入門 - 無作為割り当てが出来ない時の因果効果推定 -
 
Tokyo r #37 Rubin's Rule
Tokyo r #37 Rubin's RuleTokyo r #37 Rubin's Rule
Tokyo r #37 Rubin's Rule
 
E rstroke.m4lecture
E rstroke.m4lectureE rstroke.m4lecture
E rstroke.m4lecture
 
TBI Field Triage
TBI Field TriageTBI Field Triage
TBI Field Triage
 
Jaam2008.10651
Jaam2008.10651Jaam2008.10651
Jaam2008.10651
 
JAAM FORECAST study (Trauma) in Japanese
JAAM FORECAST study (Trauma) in JapaneseJAAM FORECAST study (Trauma) in Japanese
JAAM FORECAST study (Trauma) in Japanese
 
整形外科プライマリーケア 創の処置
整形外科プライマリーケア 創の処置整形外科プライマリーケア 創の処置
整形外科プライマリーケア 創の処置
 
Diag test.shiraishi.2
Diag test.shiraishi.2Diag test.shiraishi.2
Diag test.shiraishi.2
 
有意性と効果量について しっかり考えてみよう
有意性と効果量について しっかり考えてみよう有意性と効果量について しっかり考えてみよう
有意性と効果量について しっかり考えてみよう
 
エクセルで統計分析 統計プログラムHADについて
エクセルで統計分析 統計プログラムHADについてエクセルで統計分析 統計プログラムHADについて
エクセルで統計分析 統計プログラムHADについて
 

傾向スコアマッチと多重補完法の解説 その2