5. 経験分布
Empirical distribution
• データそのものから導かれる分布のこと
o イメージ的には、ヒストグラム
o N個の標本(y1,y2,,,,,yn)の各点に関して1/nの確率を割り当てる離散型確率分布
• 未知の母集団分布F(y)
o 経験分布関数 はF(y)に分布収束する。
9. Cramér-Raoの下限と効率
• Fisher情報量(I(θ))の復習
o f(Y;θ)は尤度関数
o 意味:1回微分の分散か2回微分の期待値
• いくつかの正則条件のもとで
o クラメール・ラオの下限 (ただし、 )
• の分散がクラメール・ラオの下限を達成するときに、
を有効推定量(Efficient estimator)
o 最尤推定量が有効推定量であることは稀。通常は漸近的に達成(漸近有効)
10. ブートストラップ誤差
• 統計的誤差
o 差込原理より として近似したことからくる誤差
o どうしようもないから諦めよう!(提案)
o でも、nは大きくしようね!
• モンテカルロ誤差
o シミュレーションに基づく誤差
o 何回反復させるかに依存しているので、十分回数やろう!
o で、結局何回くらいが適当なの?
• nが大きい場合、反復回数を増やす
• 中央値のような標本の滑らかなでない関数の場合反復回数を増やす
o Efron and Tibshirani(1993) によると、分散や標準誤差のブートストラップ推定
の場合は25-300回程度十分らしい!
11. Jackknife法
• もう一つのリサンプリング法
o 重複を許さないリサンプリング法
o 狭義にはこんなかんじで1つだけサンプルを抜いてリサンプリング
o イメージ的にはCross validationによく似ている。
• どうでもいいけど、語源は「キャンプ場ですげー便利」
• 利点
o Bootstrapよりちょっと早い
• 欠点
o 統計量が平滑でない値の場合、失敗する場合がある。(ex. Median)
o 平滑性=データの変化がどれくらい統計量を変化させるか
13. Bootstrap信頼区間
• 標準正規Bootstrap CI
• 基本Bootstrap CI
• Percentile Bootstrap CI
• Bootstrap T CI
• BCa法 (Bias corrected and accelerated method)
o 性能や特性など詳しくは、A.C. Davison et al(1997)
14. 標準正規/基本 B-CI
• 標準正規CI
o まぁ想像通りです。
o 仮定が強い
• の分布が正規分布 or
• が標本平均 and サンプルサイズが大きい(中心極限定理)
• 基本CI
o Bootstrap近似に基づく。
• と近似(この分位点を計算)→誤差が大きいかも
o ただし、 の経験累積分布から標本のα分位点
15. Bootstrap T CI
• 基本Bootstrap CIの場合、 としているので、
分布のずれがある場合うまく行かない!
o 一次の正確度しかないから
• 一次の正確度:
• Cは被覆誤差
• C→0 (n→∞)がであってほしい
上側信頼限界
• それじゃ、二次のモーメント(分散)まで考えてみればいい
じゃない!”t型”統計量の標本分布をリサンプリングで作成
• 信頼区間
o は、 のα/2番目に小さい値
16. Bootstrap T CI
• 信頼区間
o は、 のα/2番目に小さい値
• 長所
o 二次の正確性を持つ:
• 短所
o σの推定が不可欠→ブートストラップ標本ごとにσを計算しなけれならないので、
計算負荷が大きい(つまり、ブートストラップのなかにブートストラップの入
れ子構造)