O slideshow foi denunciado.
Utilizamos seu perfil e dados de atividades no LinkedIn para personalizar e exibir anúncios mais relevantes. Altere suas preferências de anúncios quando desejar.
復元抽出と
乱数シミュレーションを
⽤いた信頼区間の検討
kusanagi@nagoya-u.jp
Nagoya R #11
2013/12/5
名古屋⼤学国際開発研究科
信頼区間
• ⺟数がどのような数値の範囲にあるか

– Cf. 予測区間(標本値の推定範囲)
– 統計量(標本から求められる⺟集団の⺟数の推定
量)
– 確率
• 95%, 99%

– 求め⽅
•
•
•
•

パラメトリック
ノンパラメトリ...
信頼区間
• 情報量の多さ

– スケールが失われない
– 推定の正しさも加味される

• APAでも報告を推奨されている(APA,
2009)
• 統計的仮説検定に依存せず,効果量,検
定⼒などと合わせ吟味すべき
信頼区間
• 確率分布に基づく⺟平均の計算例

– 正規分布を考える
– 点推定:標本の平均値(M)→⺟平均(μ)の
推定値とみなす
– 区間推定: M ± t(df, 任意の確率)×(SD/√N)
– Nが∞時,t値は約1.96(95%)にな...
信頼区間
• Rで計算してみる
– ⾃作関数 pmci

pmci <‐ function(data)
{
l1 <‐ mean(data)‐qt(0.975, length(data)‐
1)*(sd(data)/sqrt(length(da...
信頼区間
• 可視化したり報告したり
– 95% CI [下限, 上限]
リサンプリング
• 確率分布に基づく計算

– 条件が多い
– 数学的にもやや複雑
– 理想化が激しい
– 条件を取っ払い計算機の⼒で代⽤しよう!
リサンプリング
• リサンプリングとは

– 標本から再度標本を作り出す統計⼿法全般

• 様々な⽅法

– パラメトリック

• 標本値から得られた確率密度関数に従う乱数を⽣成す
る⽅法(モンテカルロ法)

– ノンパラメトリック

• 元標...
リサンプリング
• 理屈

– 元標本から⽣成された⼤数のブートストラッ
プ標本の分布は⺟分布に近似する
• 標本は⺟集団の⼀部
• 標本値を再度選ぶのは⺟集団からもう⼀個取るの
と同じ
乱数シミュレーション
• ⼿順

– あるテスト,30個の標本を得た
– 元標本から推定されたμとσはそれぞれ,73.21,
10,24だった
– その分布に従う30個(ブートストラップ標本サ
イズ)の乱数を1000個作る(ブートストラップ
標...
乱数シミュレーション
• Rでやってみる

– bsm <- numeric(0)
– for(i in 1:1000){bs <- rnorm(30,73.21,10.24); bsm[i] <- mean(bs)}
– hist(bsm)
...
復元抽出
• ブートストラップ信頼区間の計算法
– パーセンタイル法

• ⼀番シンプル
• ブートストラップ標本それぞれにおける統計量の
順序区間を信頼区間とみなす

– パーセンタイルt法
– BCa法
– ベーシック法…
復元抽出
• ⼿順

– あるテスト,30個の標本(元標本)を得た
– 30個から重複有りで,30個標本値を取り出す
(ブートストラップ標本)
– そのブートストラップ標本毎に平均値を求め
る
– 1000個のブートストラップ平均値の分布は⺟
...
復元抽出
• Rでやってみよう!

– bsm <- numeric(0)
– for(i in 1:1000){bs <- sample(dat, 30, replace=T);bsm[i]
<- mean(bs)}
– quantile(b...
応⽤
• 基本的にどんな統計量でもできる
–
–
–
–
–
–

平均差
平均差の検定のt値,有意確率
効果量
回帰係数
相関係数
信頼性係数

– 形態素習得研究におけるGSM(草薙, 2013a)
応⽤
• ⼆変数の標準化平均差(Cohenʼs d)の
ブートストラップ信頼区間
•
•
•
•
•
•
•
•

bootd(tests, 1000, 10)
$summary
Min. 1st Qu.  Median    Mean 3rd...
応⽤
• ブートストラップ標本における標準化平均差の累積順位
– 追⾏確率関数の推定

• 上記のデータだと1000回中687個のデータが負の効果量を取った
ということ。
• 同条件で実験した場合,⼤体69%は同じ符号の効果量を取りそう
だとい...
可視化

草薙(2013b)

⺟平均値
Point estimate
Flat adverb

Point estimate
Effect size d

95% CI

0.19

[0.36, 0.74]

526

[492, 559]...
可視化

Reading time (ms)

草薙(2013b)
Flat adverb
ly adverb

700
600
500
400
slow

straight different

late

close

quick

dee...
ただし
• ブートストラップは元標本に依存する
– 適⽤でない場合も勿論ある

• あくまでも,ひとつのシミュレーション
的データとして解釈すべき
• ⼀回ごとに違う数値になる
復元抽出と
乱数シミュレーションを
⽤いた信頼区間の検討
やってみようず!
草薙邦広(2013a)「形態素習得研究とリサンプリング」 Nagoya R #10, 名古屋⼤学国際開発研究科.
http://www.slideshare.net/K...
Próximos SlideShares
Carregando em…5
×

草薙 2013 nagoyar11 復元抽出と乱数シミュレーションによる信頼区間の検討

1.731 visualizações

Publicada em

草薙邦広「復元抽出と乱数シミュレーションを用いた信頼区間の検討」2013年12月7日. Nagoya R #11, 名古屋大学国際開発研究科.

  • Seja o primeiro a comentar

  • Seja a primeira pessoa a gostar disto

草薙 2013 nagoyar11 復元抽出と乱数シミュレーションによる信頼区間の検討

  1. 1. 復元抽出と 乱数シミュレーションを ⽤いた信頼区間の検討
  2. 2. kusanagi@nagoya-u.jp Nagoya R #11 2013/12/5 名古屋⼤学国際開発研究科
  3. 3. 信頼区間 • ⺟数がどのような数値の範囲にあるか – Cf. 予測区間(標本値の推定範囲) – 統計量(標本から求められる⺟集団の⺟数の推定 量) – 確率 • 95%, 99% – 求め⽅ • • • • パラメトリック ノンパラメトリック 確率分布に基づく計算 ブートストラップ
  4. 4. 信頼区間 • 情報量の多さ – スケールが失われない – 推定の正しさも加味される • APAでも報告を推奨されている(APA, 2009) • 統計的仮説検定に依存せず,効果量,検 定⼒などと合わせ吟味すべき
  5. 5. 信頼区間 • 確率分布に基づく⺟平均の計算例 – 正規分布を考える – 点推定:標本の平均値(M)→⺟平均(μ)の 推定値とみなす – 区間推定: M ± t(df, 任意の確率)×(SD/√N) – Nが∞時,t値は約1.96(95%)になる
  6. 6. 信頼区間 • Rで計算してみる – ⾃作関数 pmci pmci <‐ function(data) { l1 <‐ mean(data)‐qt(0.975, length(data)‐ 1)*(sd(data)/sqrt(length(data))) u1 <‐ mean(data)+qt(0.975, length(data)‐ 1)*(sd(data)/sqrt(length(data))) l2 <‐ mean(data)‐qt(0.995, length(data)‐ 1)*(sd(data)/sqrt(length(data))) u2 <‐ mean(data)+qt(0.995, length(data)‐ 1)*(sd(data)/sqrt(length(data))) list("95%CI:lower"=l1, "95%CI:upper"=u1,  "99%CI:lower"=l2, "99%CI:upper"=u2) }
  7. 7. 信頼区間 • 可視化したり報告したり – 95% CI [下限, 上限]
  8. 8. リサンプリング • 確率分布に基づく計算 – 条件が多い – 数学的にもやや複雑 – 理想化が激しい – 条件を取っ払い計算機の⼒で代⽤しよう!
  9. 9. リサンプリング • リサンプリングとは – 標本から再度標本を作り出す統計⼿法全般 • 様々な⽅法 – パラメトリック • 標本値から得られた確率密度関数に従う乱数を⽣成す る⽅法(モンテカルロ法) – ノンパラメトリック • 元標本を複数抽出することによってブートストラップ 標本を作り出す⼿法 • 復元抽出(replacement): – 抽出の重複を認めるか – 認める/認めない(ジャックナイフ法)
  10. 10. リサンプリング • 理屈 – 元標本から⽣成された⼤数のブートストラッ プ標本の分布は⺟分布に近似する • 標本は⺟集団の⼀部 • 標本値を再度選ぶのは⺟集団からもう⼀個取るの と同じ
  11. 11. 乱数シミュレーション • ⼿順 – あるテスト,30個の標本を得た – 元標本から推定されたμとσはそれぞれ,73.21, 10,24だった – その分布に従う30個(ブートストラップ標本サ イズ)の乱数を1000個作る(ブートストラップ 標本数,B) – そのブートストラップ標本毎に平均値を求める – 1000個のブートストラップ平均値の分布は⺟平 均値の分布に近似するだろう →可視化したりできるし,順序区間を信頼区間と みなすことによって区間を推定できる!
  12. 12. 乱数シミュレーション • Rでやってみる – bsm <- numeric(0) – for(i in 1:1000){bs <- rnorm(30,73.21,10.24); bsm[i] <- mean(bs)} – hist(bsm) – quantile(bsm, c(0.025, 0.975))
  13. 13. 復元抽出 • ブートストラップ信頼区間の計算法 – パーセンタイル法 • ⼀番シンプル • ブートストラップ標本それぞれにおける統計量の 順序区間を信頼区間とみなす – パーセンタイルt法 – BCa法 – ベーシック法…
  14. 14. 復元抽出 • ⼿順 – あるテスト,30個の標本(元標本)を得た – 30個から重複有りで,30個標本値を取り出す (ブートストラップ標本) – そのブートストラップ標本毎に平均値を求め る – 1000個のブートストラップ平均値の分布は⺟ 平均値の分布に近似するだろう →可視化したりできるし,順序区間を信頼区間 とみなすことによって区間を推定できる!
  15. 15. 復元抽出 • Rでやってみよう! – bsm <- numeric(0) – for(i in 1:1000){bs <- sample(dat, 30, replace=T);bsm[i] <- mean(bs)} – quantile(bsm, c(0.025, 0.975))
  16. 16. 応⽤ • 基本的にどんな統計量でもできる – – – – – – 平均差 平均差の検定のt値,有意確率 効果量 回帰係数 相関係数 信頼性係数 – 形態素習得研究におけるGSM(草薙, 2013a)
  17. 17. 応⽤ • ⼆変数の標準化平均差(Cohenʼs d)の ブートストラップ信頼区間 • • • • • • • • bootd(tests, 1000, 10) $summary Min. 1st Qu.  Median    Mean 3rd Qu.    Max. ‐1.4590 ‐0.4546 ‐0.2484 ‐0.2233  0.0000  0.8784 $`95%CI` 2.5%      97.5% ‐0.8994050  0.5433483 bootd <‐ function(x, n.boot, n.sub) { meany = numeric(0) for(i in 1:n.boot) { subs <‐ x[sample(nrow(x),n.sub,replace=TRUE),] y[i] <‐ c((mean(subs[,1])‐ mean(subs[,2]))/(sqrt((sd(subs[,1])^2+sd(subs[,2])^2)/2))) meany[i] <‐mean(y) } par(mfrow=c(1,3)) boxplot(y, ylab="score")  plot(meany, xlab="", ylab="score") hist(y, ylab="frequency",  xlab="score", main="") list("summary"=summary(y),"95%CI"=quantile(y,p=c( 0.025,0.975)), "sd"=sd(y)) }
  18. 18. 応⽤ • ブートストラップ標本における標準化平均差の累積順位 – 追⾏確率関数の推定 • 上記のデータだと1000回中687個のデータが負の効果量を取った ということ。 • 同条件で実験した場合,⼤体69%は同じ符号の効果量を取りそう だといえる
  19. 19. 可視化 草薙(2013b) ⺟平均値 Point estimate Flat adverb Point estimate Effect size d 95% CI 0.19 [0.36, 0.74] 526 [492, 559] Adj-ly adverb 効果量 95% CI 509 [484, 538]
  20. 20. 可視化 Reading time (ms) 草薙(2013b) Flat adverb ly adverb 700 600 500 400 slow straight different late close quick deep safe
  21. 21. ただし • ブートストラップは元標本に依存する – 適⽤でない場合も勿論ある • あくまでも,ひとつのシミュレーション 的データとして解釈すべき • ⼀回ごとに違う数値になる
  22. 22. 復元抽出と 乱数シミュレーションを ⽤いた信頼区間の検討 やってみようず! 草薙邦広(2013a)「形態素習得研究とリサンプリング」 Nagoya R #10, 名古屋⼤学国際開発研究科. http://www.slideshare.net/Kunihiro_KUSANAGI/nagoyar‐24447878  草薙邦広 (2013b) 「第⼆⾔語としての英語における単純形副詞のオンライン処理:⾃⼰ペース読み課題 を⽤いた予備的検討」 第82回外国語教育メディア学会中部⽀部秋季研究⼤会. 中部⼤学. http://www.slideshare.net/Kunihiro_KUSANAGI/let2013‐flatadverb 

×