SlideShare uma empresa Scribd logo
1 de 54
Baixar para ler offline
みどりぼん読書会10章  
階層ベイズモデル 
-GLMMのベイズモデル化-(後半) 
@tetsuroito 
2014/09/30  @dwango 
2014年9月30日火曜日
自己紹介 
名前:伊藤 徹郎(@tetsuroito) 
近況:恵比寿のお店を開拓中 
マイブーム:クッキング 
冬が待ち遠しい今日この頃 
2014年9月30日火曜日
マイルストーン 
イマココ! 
だいぶ終盤に差し掛かりました 
2014年9月30日火曜日
前半でやったこと 
GLMMを階層ベイズモデル化 
階層ベイズモデルのMCMCサンプリング 
階層ベイズモデルの事後分布推定と予測 
2014年9月30日火曜日
後半のお品書き 
10.4 ベイズモデルで使う様々な事前分布 
10.5 個体差+場所差の階層ベイズモデル 
10.6 まとめと参考文献 
2014年9月30日火曜日
ベイズ統計モデルの設計で重要なこと 
よく使われる3種類の事前分布 
10.4 ベイズモデルで使う様々な事前分布 
2014年9月30日火曜日
ベイズ統計モデルの設計で重要なこと 
→事前分布の選択 
よく使われる3種類の事前分布 
10.4 ベイズモデルで使う様々な事前分布 
2014年9月30日火曜日
ベイズ統計モデルの設計で重要なこと 
→事前分布の選択 
よく使われる3種類の事前分布 
1,主観的な事前分布2,無情報事前分布3,階層事前分布 
10.4 ベイズモデルで使う様々な事前分布 
2014年9月30日火曜日
1,主観的な事前分布 
個体差  の事前分布として使うならば‥ 
「私はこうなってると思う!」で決定する 
主観的な事前分布を使う場合 
10.4 ベイズモデルで使う様々な事前分布 
2014年9月30日火曜日
1,主観的な事前分布 
個体差  の事前分布として使うならば‥ 
「私はこうなってると思う!」で決定する 
→でも、この本では使いません 
主観的な事前分布を使う場合 
10.4 ベイズモデルで使う様々な事前分布 
2014年9月30日火曜日
1,主観的な事前分布 
個体差  の事前分布として使うならば‥ 
「私はこうなってると思う!」で決定する 
→でも、この本では使いません 
主観的な事前分布を使う場合 
連続値の観測値xに関する測定時の誤測定が大きい場合 
→スペックなどで測定ばらつきを主観で決定 
10.4 ベイズモデルで使う様々な事前分布 
2014年9月30日火曜日
2,無情報事前分布 
事前分布が事後分布に影響を与えないようにしたい場合に用いる 
久保先生の談話 
「データの読み上げみたいなもの」「統計モデリングじゃない」 
4章の4.2節に登場したフルモデルみたいの (懐かしいですね) 
10.4 ベイズモデルで使う様々な事前分布 
2014年9月30日火曜日
2,無情報事前分布 
事前分布が事後分布に影響を与えないようにしたい場合に用いる 
久保先生の談話 
「データの読み上げみたいなもの」「統計モデリングじゃない」 
4章の4.2節に登場したフルモデルみたいの (懐かしいですね) 
→これも、メインでは使いません 
10.4 ベイズモデルで使う様々な事前分布 
2014年9月30日火曜日
そういえば‥ 
10.4 ベイズモデルで使う様々な事前分布 
2014年9月30日火曜日
そういえば‥ 
10.4 ベイズモデルで使う様々な事前分布 
2014年9月30日火曜日
そういえば‥ 
こんな主張ありました 
10.4 ベイズモデルで使う様々な事前分布 
2014年9月30日火曜日
3,階層事前分布 
→10.3の例題ではこちらを使用 
10.4 ベイズモデルで使う様々な事前分布 
2014年9月30日火曜日
3,階層事前分布 
→10.3の例題ではこちらを使用 
個体差  の事前分布p( |s)を階層事前分布 
平均=0,標準偏差sの正規分布 
10.4 ベイズモデルで使う様々な事前分布 
2014年9月30日火曜日
3,階層事前分布 
→10.3の例題ではこちらを使用 
個体差  の事前分布p( |s)を階層事前分布 
平均=0,標準偏差sの正規分布 
正規分布sの事前分布は無情報事前分布を設定 
10.4 ベイズモデルで使う様々な事前分布 
2014年9月30日火曜日
3,階層事前分布 
→10.3の例題ではこちらを使用 
個体差  の事前分布p( |s)を階層事前分布 
平均=0,標準偏差sの正規分布 
正規分布sの事前分布は無情報事前分布を設定 
→階層構造はこれより深くはならない 
10.4 ベイズモデルで使う様々な事前分布 
2014年9月30日火曜日
事前分布に何を選択すればよいの? 
10.4 ベイズモデルで使う様々な事前分布 
2014年9月30日火曜日
事前分布に何を選択すればよいの? 
→パラメータがデータ全体のどの範囲を説明しているか? 
10.4 ベイズモデルで使う様々な事前分布 
2014年9月30日火曜日
事前分布に何を選択すればよいの? 
→パラメータがデータ全体のどの範囲を説明しているか? 
データ全体を大域的に説明する少数パラメータ 
データの一部を説明する局所的パラメータ 
10.4 ベイズモデルで使う様々な事前分布 
2014年9月30日火曜日
10.3の例題のコードをおさらい 
model 
10.4 ベイズモデルで使う様々な事前分布 
{" 
for(i in 1:N){ 
" " Y[i] ~ dbin(q[i],8)" #二項分布 
" " logit(q[i]) <- beta + r[i]" #生存確率 
" } 
" beta ~ dnorm(0,1.0E-4)" #無情報事前分布 
" for(i in 1:N){ 
" " r[i] ~ dnorm(0,tau)" #階層事前分布 
" } 
" tau <- 1/(s * s)" #tauは分散の逆数 
" s ~ dunif(0,1.0E+4)"#無情報事前分布 
} 
2014年9月30日火曜日
10.3の例題で言えば‥ 
10.4 ベイズモデルで使う様々な事前分布 
2014年9月30日火曜日
10.3の例題で言えば‥ 
切片β→データ全体を説明する大域パラメータ 
100個の個体差[ ]→局所的パラメータ 
10.4 ベイズモデルで使う様々な事前分布 
2014年9月30日火曜日
10.3の例題で言えば‥ 
切片β→データ全体を説明する大域パラメータ 
100個の個体差[ ]→局所的パラメータ 
→階層事前分布を設定するのは後者ということになる 
10.4 ベイズモデルで使う様々な事前分布 
2014年9月30日火曜日
階層ベイズモデル 
多数の局所的パラメータを制御するため、  
階層事前分布を設定 
この階層事前分布を少数の大域的パラメータ 
で支配する 
10.4 ベイズモデルで使う様々な事前分布 
2014年9月30日火曜日
not only個体差 but also場所差 
10.5個体差+場所差の階層ベイズモデル 
2014年9月30日火曜日
not only個体差 but also場所差 
植木鉢が10個あり、[A,‥,E](白):無処理 
         [F,‥,J](グレイ):施肥処理 
10.5個体差+場所差の階層ベイズモデル 
2014年9月30日火曜日
not only個体差 but also場所差 
植木鉢が10個あり、[A,‥,E](白):無処理 
         [F,‥,J](グレイ):施肥処理 
10.5個体差+場所差の階層ベイズモデル 
2014年9月30日火曜日
過分散や個体差、植木鉢差が存在している 
10.5個体差+場所差の階層ベイズモデル 
2014年9月30日火曜日
過分散や個体差、植木鉢差が存在している 
→データだけ見ていても、この植木鉢差の理由は不明 
10.5個体差+場所差の階層ベイズモデル 
2014年9月30日火曜日
過分散や個体差、植木鉢差が存在している 
→データだけ見ていても、この植木鉢差の理由は不明 
このデータ構造の場合‥ 
 疑似反復なので、個体差と植木鉢差を同時に 
 扱う必要性があります(7.5章を参照) 
10.5個体差+場所差の階層ベイズモデル 
2014年9月30日火曜日
GLMM化したポアソン回帰で扱える問題 
10.5個体差+場所差の階層ベイズモデル 
2014年9月30日火曜日
GLMM化したポアソン回帰で扱える問題 
個体iの種子数 のばらつきを平均 のポアソン分布 
で表現 
10.5個体差+場所差の階層ベイズモデル 
2014年9月30日火曜日
GLMM化したポアソン回帰で扱える問題 
個体iの種子数 のばらつきを平均 のポアソン分布 
で表現 
10.5個体差+場所差の階層ベイズモデル 
平均種子数 
2014年9月30日火曜日
GLMM化したポアソン回帰で扱える問題 
個体iの種子数 のばらつきを平均 のポアソン分布 
で表現 
(無情報事前分布) 
10.5個体差+場所差の階層ベイズモデル 
平均種子数 
切片 
施肥処理の有無の係数 
(無情報事前分布) 
2014年9月30日火曜日
GLMM化したポアソン回帰で扱える問題 
個体iの種子数 のばらつきを平均 のポアソン分布 
で表現 
個体iの効果 
(階層事前分布) 
10.5個体差+場所差の階層ベイズモデル 
平均種子数 
切片 
施肥処理の有無の係数 
植木鉢jの効果 
(無情報事前分布) 
(無情報事前分布) 
(階層事前分布) 
2014年9月30日火曜日
GLMM化したポアソン回帰で扱える問題 
個体iの種子数 のばらつきを平均 のポアソン分布 
で表現 
個体iの効果 
(階層事前分布) 
(階層事前分布) のばらつき 
10.5個体差+場所差の階層ベイズモデル 
平均種子数 
切片 
施肥処理の有無の係数 
植木鉢jの効果 
(無情報事前分布) 
(無情報事前分布) 
(0~10^4の一様分布) 
2014年9月30日火曜日
個体差+植木鉢差の階層ベイズモデル概要 
10.5個体差+場所差の階層ベイズモデル 
2014年9月30日火曜日
WinBUGSを使って推定 
model 
{ 
! for (i in 1:N.sample) { 
! ! Y[i] ~ dpois(lambda[i]) 
! ! log(lambda[i]) <- beta1 + beta2 * F[i] + r[i] + rp[Pot[i]] 
! } 
! beta1 ~ dnorm(0, 1.0E-4) 
! beta2 ~ dnorm(0, 1.0E-4) 
! for (i in 1:N.sample) { 
! ! r[i] ~ dnorm(0, tau[1]) 
! } 
! for (j in 1:N.pot) { 
! ! rp[j] ~ dnorm(0, tau[2]) 
! } 
! for (k in 1:N.tau) { 
! ! tau[k] <- 1.0 / (s[k] * s[k]) 
! ! s[k] ~ dunif(0, 1.0E+4) 
! } 
} 
10.5個体差+場所差の階層ベイズモデル 
2014年9月30日火曜日
だが、しかし‥ 
WinBUGSでry)‥ 
とある10.5個体差+場所差の階層ベイズモデル 
2014年9月30日火曜日
RのMCMCglmm()でもできそう 
http://hosho.ees.hokudai.ac.jp/~kubo/ce/McmcGlmm.html#toc2 
stanでもできそう 
http://ito-hi.blog.so-net.ne.jp/2012-09-04 
※詳細はWEBでチェック! 
10.5個体差+場所差の階層ベイズモデル 
2014年9月30日火曜日
stanで推定された結果を拝借 
ちゃんとパラメータ推定できている 
10.5個体差+場所差の階層ベイズモデル 
2014年9月30日火曜日
10.6まとめと参考文献 
2014年9月30日火曜日
GLMMをベイズモデル化→階層ベイズモデル 
10.6まとめと参考文献 
2014年9月30日火曜日
GLMMをベイズモデル化→階層ベイズモデル 
階層ベイズは事前分布となる確率分布の 
 パラメータにも事前分布が指定されている 
10.6まとめと参考文献 
2014年9月30日火曜日
GLMMをベイズモデル化→階層ベイズモデル 
階層ベイズは事前分布となる確率分布の 
 パラメータにも事前分布が指定されている 
主観を排し、無情報、階層事前分布を使う! 
10.6まとめと参考文献 
2014年9月30日火曜日
GLMMをベイズモデル化→階層ベイズモデル 
階層ベイズは事前分布となる確率分布の 
 パラメータにも事前分布が指定されている 
主観を排し、無情報、階層事前分布を使う! 
複雑な構造の統計モデリングでは、階層ベイズ 
モデルとMCMCサンプリングによるパラメータ 
推定の組み合わせで対処する 
10.6まとめと参考文献 
2014年9月30日火曜日
注意点 
統計モデルと推定方法の区別に注意! 
10.6まとめと参考文献 
2014年9月30日火曜日
注意点 
統計モデルと推定方法の区別に注意! 
統計モデル:階層ベイズモデル 
推定方法 :MCMCサンプリング 
10.6まとめと参考文献 
2014年9月30日火曜日
おまけ 
先日のjulia tokyoでMCMCの発表があった 
2014年9月30日火曜日
ご清聴ありがとうございました! 
2014年9月30日火曜日

Mais conteúdo relacionado

Mais de tetsuro ito

[Up用]rでqr
[Up用]rでqr[Up用]rでqr
[Up用]rでqrtetsuro ito
 
20170912 data analyst meetup tokyo vol.5
20170912 data analyst meetup tokyo vol.5 20170912 data analyst meetup tokyo vol.5
20170912 data analyst meetup tokyo vol.5 tetsuro ito
 
DataOps in Moneyforward
DataOps in Moneyforward DataOps in Moneyforward
DataOps in Moneyforward tetsuro ito
 
20170207 bigdata analytics_tokyo講演資料
20170207 bigdata analytics_tokyo講演資料20170207 bigdata analytics_tokyo講演資料
20170207 bigdata analytics_tokyo講演資料tetsuro ito
 
20161029 dots machine learning in money forward
20161029 dots machine learning in money forward20161029 dots machine learning in money forward
20161029 dots machine learning in money forwardtetsuro ito
 
20160906 bq sushi
20160906 bq sushi20160906 bq sushi
20160906 bq sushitetsuro ito
 
TokyoR LT Rで連続データを離散化
TokyoR LT Rで連続データを離散化TokyoR LT Rで連続データを離散化
TokyoR LT Rで連続データを離散化tetsuro ito
 
20150531分析プラットホームとその技術(bizreach) cookpad ito #dcube_analysis
20150531分析プラットホームとその技術(bizreach) cookpad ito #dcube_analysis20150531分析プラットホームとその技術(bizreach) cookpad ito #dcube_analysis
20150531分析プラットホームとその技術(bizreach) cookpad ito #dcube_analysistetsuro ito
 
20150303続パタ5章後半
20150303続パタ5章後半20150303続パタ5章後半
20150303続パタ5章後半tetsuro ito
 
PRML読書会1スライド(公開用)
PRML読書会1スライド(公開用)PRML読書会1スライド(公開用)
PRML読書会1スライド(公開用)tetsuro ito
 
20140614 tokyo r lt
20140614 tokyo r lt 20140614 tokyo r lt
20140614 tokyo r lt tetsuro ito
 
20140329 tokyo r lt 「カーネルとsvm」
20140329 tokyo r lt 「カーネルとsvm」20140329 tokyo r lt 「カーネルとsvm」
20140329 tokyo r lt 「カーネルとsvm」tetsuro ito
 
20140204はじパタlt
20140204はじパタlt20140204はじパタlt
20140204はじパタlttetsuro ito
 
Japan.r 2013 「実ビジネスデータへのrの活用とその限界」
Japan.r 2013 「実ビジネスデータへのrの活用とその限界」Japan.r 2013 「実ビジネスデータへのrの活用とその限界」
Japan.r 2013 「実ビジネスデータへのrの活用とその限界」tetsuro ito
 
はじパタ8章 svm
はじパタ8章 svmはじパタ8章 svm
はじパタ8章 svmtetsuro ito
 
Tokyo R LT 20131109
Tokyo R LT 20131109Tokyo R LT 20131109
Tokyo R LT 20131109tetsuro ito
 
はじパタ2章
はじパタ2章はじパタ2章
はじパタ2章tetsuro ito
 
第31回TokyoR LT資料
第31回TokyoR LT資料第31回TokyoR LT資料
第31回TokyoR LT資料tetsuro ito
 
集合知プログラミング5章発表
集合知プログラミング5章発表集合知プログラミング5章発表
集合知プログラミング5章発表tetsuro ito
 
集合知プログラミング11章
集合知プログラミング11章集合知プログラミング11章
集合知プログラミング11章tetsuro ito
 

Mais de tetsuro ito (20)

[Up用]rでqr
[Up用]rでqr[Up用]rでqr
[Up用]rでqr
 
20170912 data analyst meetup tokyo vol.5
20170912 data analyst meetup tokyo vol.5 20170912 data analyst meetup tokyo vol.5
20170912 data analyst meetup tokyo vol.5
 
DataOps in Moneyforward
DataOps in Moneyforward DataOps in Moneyforward
DataOps in Moneyforward
 
20170207 bigdata analytics_tokyo講演資料
20170207 bigdata analytics_tokyo講演資料20170207 bigdata analytics_tokyo講演資料
20170207 bigdata analytics_tokyo講演資料
 
20161029 dots machine learning in money forward
20161029 dots machine learning in money forward20161029 dots machine learning in money forward
20161029 dots machine learning in money forward
 
20160906 bq sushi
20160906 bq sushi20160906 bq sushi
20160906 bq sushi
 
TokyoR LT Rで連続データを離散化
TokyoR LT Rで連続データを離散化TokyoR LT Rで連続データを離散化
TokyoR LT Rで連続データを離散化
 
20150531分析プラットホームとその技術(bizreach) cookpad ito #dcube_analysis
20150531分析プラットホームとその技術(bizreach) cookpad ito #dcube_analysis20150531分析プラットホームとその技術(bizreach) cookpad ito #dcube_analysis
20150531分析プラットホームとその技術(bizreach) cookpad ito #dcube_analysis
 
20150303続パタ5章後半
20150303続パタ5章後半20150303続パタ5章後半
20150303続パタ5章後半
 
PRML読書会1スライド(公開用)
PRML読書会1スライド(公開用)PRML読書会1スライド(公開用)
PRML読書会1スライド(公開用)
 
20140614 tokyo r lt
20140614 tokyo r lt 20140614 tokyo r lt
20140614 tokyo r lt
 
20140329 tokyo r lt 「カーネルとsvm」
20140329 tokyo r lt 「カーネルとsvm」20140329 tokyo r lt 「カーネルとsvm」
20140329 tokyo r lt 「カーネルとsvm」
 
20140204はじパタlt
20140204はじパタlt20140204はじパタlt
20140204はじパタlt
 
Japan.r 2013 「実ビジネスデータへのrの活用とその限界」
Japan.r 2013 「実ビジネスデータへのrの活用とその限界」Japan.r 2013 「実ビジネスデータへのrの活用とその限界」
Japan.r 2013 「実ビジネスデータへのrの活用とその限界」
 
はじパタ8章 svm
はじパタ8章 svmはじパタ8章 svm
はじパタ8章 svm
 
Tokyo R LT 20131109
Tokyo R LT 20131109Tokyo R LT 20131109
Tokyo R LT 20131109
 
はじパタ2章
はじパタ2章はじパタ2章
はじパタ2章
 
第31回TokyoR LT資料
第31回TokyoR LT資料第31回TokyoR LT資料
第31回TokyoR LT資料
 
集合知プログラミング5章発表
集合知プログラミング5章発表集合知プログラミング5章発表
集合知プログラミング5章発表
 
集合知プログラミング11章
集合知プログラミング11章集合知プログラミング11章
集合知プログラミング11章
 

20140930 みどりぼん10章後半 階層ベイズモデル -GLMMのベイズモデル化-(後半)