SlideShare uma empresa Scribd logo
1 de 49
ノンパラメトリックベイズ
4章 クラスタリング
担当 fluct中野智文
4.1 k平均アルゴリズム
• K個のクラスにデータ点
を分類
• 各クラスの代表点:
• の距離を定
義して代表点が近いクラス
へ分類
http://aidiary.hatenablog.com/entry/20120813/1344853878
• がクラス に属する:
•zは隠れ変数、潜在変数とよばれる
•K-平均アルゴリズムは、各クラス内の平均とそれが
属するデータ点との距離が最小となる
を求める。すなわち
※著作権保護のため画質が悪くなっています。
アルゴリズム4.1
4.2 混合ガウスモデルのギブスサンプリングによ
るクラスタリング
?
成り立てば1, でなければ0
Ziに連動して平均が変化
対数化したガウス分布
•最適化問題は、
となる
※著作権保護のため画質が悪くなっています。
•アルゴリズム4.1(3)(i)を次のように書き換えられる
よって、次の最大化問題と考えることが出来る
K個のガウス分布 にもとづき、
•データごとに最も尤度が高いクラスを選択→
• から平均を最尤推定している→
分布に基づいたランダムに
4.2.1分散固定の場合
•データ は
と生成されると仮定する
標準ガウス分布 一様分布
生成したいパラメータ
データ
テンポラリな
パラメータ
事前分布
(正則化)
•だから、
ベイズの定理
分母は固定だから消え
る
グラフィカルモデルよ
り関係のある部分の
み残す
これが知りたかった?
正規化
結合確率に比例
グラフィカルモデルよ
り関係のある部分の
み残す
ここで
•条件部の依存関係
•よって、
正規分布だから正規
化は必要ない?
アルゴリズム4.2
4.2.2 分散も確率変数とする場合
•データ は
と生成されると仮定する
Zipf's の法則的な
何かとか
「正規分布の分散の
事前分布」と1章の時
のメモ
再掲
結合確率
条件付き分布は
正規化
ここで
τが共通でない
とうまくいかな
いという
ここで
積分消去すれば
アルゴリズム4.3
4.3 混合ガウスモデルの周辺化ギブスサンプリン
グによるクラスタリング
周辺化
逐次的に
結合分布
グラフィカルモデルより、
となります。ただし
は条件付き独立とはいかない。
下記(3章で説明があった)より、
よって結合確率
条件付き分布
なぜそうなったのか
積分記号?
ノンパラメト
リックベイズ
はここを拡張
(4.31)?
ノンパラメト
リックベイズ
はここを拡張
アルゴリズム4.4

Mais conteúdo relacionado

Mais procurados

はじめてのパターン認識 第5章 k最近傍法(k_nn法)
はじめてのパターン認識 第5章 k最近傍法(k_nn法)はじめてのパターン認識 第5章 k最近傍法(k_nn法)
はじめてのパターン認識 第5章 k最近傍法(k_nn法)
Motoya Wakiyama
 

Mais procurados (20)

ベイズファクターとモデル選択
ベイズファクターとモデル選択ベイズファクターとモデル選択
ベイズファクターとモデル選択
 
StanとRでベイズ統計モデリングに関する読書会(Osaka.stan) 第四章
StanとRでベイズ統計モデリングに関する読書会(Osaka.stan) 第四章StanとRでベイズ統計モデリングに関する読書会(Osaka.stan) 第四章
StanとRでベイズ統計モデリングに関する読書会(Osaka.stan) 第四章
 
PRML輪読#1
PRML輪読#1PRML輪読#1
PRML輪読#1
 
機械学習のためのベイズ最適化入門
機械学習のためのベイズ最適化入門機械学習のためのベイズ最適化入門
機械学習のためのベイズ最適化入門
 
ランダムフォレスト
ランダムフォレストランダムフォレスト
ランダムフォレスト
 
関数データ解析の概要とその方法
関数データ解析の概要とその方法関数データ解析の概要とその方法
関数データ解析の概要とその方法
 
ベイズ統計学の概論的紹介
ベイズ統計学の概論的紹介ベイズ統計学の概論的紹介
ベイズ統計学の概論的紹介
 
階層ベイズとWAIC
階層ベイズとWAIC階層ベイズとWAIC
階層ベイズとWAIC
 
はじめてのパターン認識 第5章 k最近傍法(k_nn法)
はじめてのパターン認識 第5章 k最近傍法(k_nn法)はじめてのパターン認識 第5章 k最近傍法(k_nn法)
はじめてのパターン認識 第5章 k最近傍法(k_nn法)
 
第4回DARM勉強会 (構造方程式モデリング)
第4回DARM勉強会 (構造方程式モデリング)第4回DARM勉強会 (構造方程式モデリング)
第4回DARM勉強会 (構造方程式モデリング)
 
階層モデルの分散パラメータの事前分布について
階層モデルの分散パラメータの事前分布について階層モデルの分散パラメータの事前分布について
階層モデルの分散パラメータの事前分布について
 
Stanコードの書き方 中級編
Stanコードの書き方 中級編Stanコードの書き方 中級編
Stanコードの書き方 中級編
 
計量経済学と 機械学習の交差点入り口 (公開用)
計量経済学と 機械学習の交差点入り口 (公開用)計量経済学と 機械学習の交差点入り口 (公開用)
計量経済学と 機械学習の交差点入り口 (公開用)
 
深層生成モデルと世界モデル
深層生成モデルと世界モデル深層生成モデルと世界モデル
深層生成モデルと世界モデル
 
変分ベイズ法の説明
変分ベイズ法の説明変分ベイズ法の説明
変分ベイズ法の説明
 
遺伝的アルゴリズム (Genetic Algorithm)を始めよう!
遺伝的アルゴリズム(Genetic Algorithm)を始めよう!遺伝的アルゴリズム(Genetic Algorithm)を始めよう!
遺伝的アルゴリズム (Genetic Algorithm)を始めよう!
 
SMO徹底入門 - SVMをちゃんと実装する
SMO徹底入門 - SVMをちゃんと実装するSMO徹底入門 - SVMをちゃんと実装する
SMO徹底入門 - SVMをちゃんと実装する
 
機械学習と主成分分析
機械学習と主成分分析機械学習と主成分分析
機械学習と主成分分析
 
GEE(一般化推定方程式)の理論
GEE(一般化推定方程式)の理論GEE(一般化推定方程式)の理論
GEE(一般化推定方程式)の理論
 
ベイズ最適化
ベイズ最適化ベイズ最適化
ベイズ最適化
 

Mais de 智文 中野

Mais de 智文 中野 (9)

ポアソン分布を仮定した 少頻度の信頼区間と経験ベイズ 〜大標本中の少頻度の信頼区間〜
ポアソン分布を仮定した 少頻度の信頼区間と経験ベイズ 〜大標本中の少頻度の信頼区間〜ポアソン分布を仮定した 少頻度の信頼区間と経験ベイズ 〜大標本中の少頻度の信頼区間〜
ポアソン分布を仮定した 少頻度の信頼区間と経験ベイズ 〜大標本中の少頻度の信頼区間〜
 
ロケーションエンジンの紹介
ロケーションエンジンの紹介ロケーションエンジンの紹介
ロケーションエンジンの紹介
 
ロバストモーメント法による超母数推定の語彙出現率への応用
ロバストモーメント法による超母数推定の語彙出現率への応用ロバストモーメント法による超母数推定の語彙出現率への応用
ロバストモーメント法による超母数推定の語彙出現率への応用
 
モーメント法に基づく超パラメータのロバスト推定
モーメント法に基づく超パラメータのロバスト推定モーメント法に基づく超パラメータのロバスト推定
モーメント法に基づく超パラメータのロバスト推定
 
Wilson score intervalを使った信頼区間の応用
Wilson score intervalを使った信頼区間の応用Wilson score intervalを使った信頼区間の応用
Wilson score intervalを使った信頼区間の応用
 
6章 最適腕識別とA/Bテスト
6章 最適腕識別とA/Bテスト6章 最適腕識別とA/Bテスト
6章 最適腕識別とA/Bテスト
 
ベルヌーイ分布における超パラメータ推定のための経験ベイズ法
ベルヌーイ分布における超パラメータ推定のための経験ベイズ法ベルヌーイ分布における超パラメータ推定のための経験ベイズ法
ベルヌーイ分布における超パラメータ推定のための経験ベイズ法
 
異常検知と変化検知 7章方向データの異常検知
異常検知と変化検知 7章方向データの異常検知異常検知と変化検知 7章方向データの異常検知
異常検知と変化検知 7章方向データの異常検知
 
ブートストラップ手法を用いた学習不用語の除去(言語と統計2015)
ブートストラップ手法を用いた学習不用語の除去(言語と統計2015)ブートストラップ手法を用いた学習不用語の除去(言語と統計2015)
ブートストラップ手法を用いた学習不用語の除去(言語と統計2015)
 

ノンパラメトリックベイズ4章クラスタリング