SlideShare uma empresa Scribd logo
1 de 23
未知パラメータを伴う 隠れマルコフモデルの状態推定 に関する一考察 前田 康成 (北見工業大学工学部) 吉田 秀樹 (北見工業大学工学部) 藤原 祥隆 (北見工業大学工学部) 松嶋 敏泰 (早稲田大学理工学部)
 本日の発表内容 未知パラメータを伴う隠れマルコフモデルの状態推定問題の概要 準備 従来研究 未知パラメータを伴う隠れマルコフモデルの状態推定の目的の整理 状態系列単位で評価する場合 ・定式化 ・ベイズ基準のもとで誤り率を最小にする推定方法 ・ベイズ解を求める DP アルゴリズム ・近似アルゴリズム 状態単位で評価する場合 ・定式化 ・ベイズ基準のもとで誤り率を最小にする推定方法 ・近似アルゴリズム 状態の有無に関して評価する場合 ・定式化 ・ベイズ基準のもとで誤り率を最小にする推定方法 まとめと今後の課題
  隠れマルコフモデル( HMM )の概要 状態  から状態  への遷移確率 状態  での記号  の生起確率 状態 記号 初期状態が生起し,記号の生起と状態遷移を繰り返す 通常,状態系列は未知で,記号系列が観測される 初期状態  の生起確率
未知パラメータを伴う隠れマルコフモデルの状態推定問題 確率分布を支配するパラメータが未知のもとで,学習データを用いて学習し, 新規の記号系列を観測して,新規の記号系列に対応する未知の状態系列を 推定する問題 単語系列を観測して,品詞系列を推定  -> 形態素解析 単語系列を観測して,クラス系列を推定  -> 複数のクラスに属する文書のクラスの推定 【応用例】 複数のクラスに属する文書の生成 単語 文書のクラス 文の生成 単語 品詞 表現するもの 記号 状態
 準備( 1/2 ) 状態 状態集合 記号 記号の集合 状態  が生起する確率分布( HMM の初期状態の生起確率) 状態  で記号  が生起する確率分布 を支配するパラメータ 真のパラメータ(未知) 状態  から状態  へ遷移する確率を示す確率分布 ( HMM の状態の遷移確率) を支配するパラメータ
 準備( 2/2 ) 学習データの  番目の系列 番目の系列の  番目の状態 番目の系列の  番目の記号 番目の系列の状態および記号の数 個の学習データ(状態系列  ,記号系列  ともに既知) 新規に状態系列を推定したい系列の組 学習データ  と新規の記号系列  を受け取ったもとで, 新規の記号系列に対応する状態系列  を推定する問題 未知パラメータを伴う隠れマルコフモデルの状態推定問題 学習データ 新規のデータ (状態系列  は未知,記号系列  は既知)
 従来研究における学習と推定方法 従来研究では未知パラメータの推定(学習)と状態推定が二つの問題に分けて検討されている 未知パラメータの推定 状態推定 最尤学習 漸近的に真のパラメータに収束することは保証されているが,有限の学習データに対して何故この推定方法を採用するかという根拠が不明確 真のパラメータ既知の場合に誤り率を最小にする推定方法に推定値を代入 -> 推定値次第 本研究では統計的決定理論の視点から未知パラメータの推定と状態推定を一つの統計的決定問題として検討する . . . (1) (2) (3)
 状態推定の目的の整理 状態  の推定結果  ・単語単位で評価する形態素解析 ・複数のクラスに属する文書の分類及びインデックスの付与 状態  単位で評価 状態系列  中に状態  が含まれるかどうかの推定結果 系列  の推定結果 出力      学習データ     新規の記号系列 入力 ・複数のクラスに属する文書の分類 ・文単位で評価する形態素解析 ・複数のクラスに属する文書の分類及びインデックス付与 用途 状態  の有無に関して評価 状態系列  単位で評価
定式化(状態系列単位)( 1/2 ) 損失関数 ただし,  は学習データと新規の記号系列を受け取ったもとで状態系列の推定結果を返す決定関数 リスク関数 . (4) (5)
ベイズリスク ただし,  は事前分布 ベイズ最適な決定関数 . . 定式化(状態系列単位)( 2/2 ) (6) (7)
ベイズ決定(状態系列単位)( 1/3 ) ベイズ最適な決定 ベイズ基準のもとで状態系列の推定を間違えてしまう確率である誤り率を 最小にする決定 事前分布に共役事前分布であるディレクレ分布を採用することにより積分部分はディレクレ分布のパラメータと頻度情報によって算出可能 . (8)
事前分布に共役事前分布であるディレクレ分布を採用した場合 学習データの各状態系列中で最初の状態が  の数 に対するディレクレ分布のパラメータ ただし, 学習データ中で状態  で記号  が生起した回数 に対するディレクレ分布のパラメータ ただし, , , ベイズ決定(状態系列単位)( 2/3 ) (9) (10)
学習データ中で状態  から状態  へ遷移した回数 に対するディレクレ分布のパラメータ ただし, 系列  で状態  で記号  が生起した回数 ただし, , , ベイズ決定(状態系列単位)( 3/3 ) (11) (12)
ベイズ解を求めるDPアルゴリズム(状態系列単位)( 1/2 ) 新規の記号系列に対応する状態系列の候補を木構造で列挙して,動的計画法(DP)を用いてベイズ解を求める 例      の場合 空列のノード 個 個 深さ 個 各ノードにその系列に対応する事後分布を保持させて,動的計画法を用いて,深さ  のノードから遡ってベイズ最適な系列を推定する
木の末端から以下の処理を再帰的に繰り返すことによって,ベイズ最適な系列が推定できる は,ノード  における部分最適解の確率 ただし, 上式で定まる部分最適解の確率,系列をそれぞれ保持しておいて, 深さ  のノードで部分最適解として利用する 深さ  の各ノードでの計算 ベイズ最適な系列の推定は可能だが,計算量はノード数に比例し, 系列長に対する指数オーダになる , ベイズ解を求めるDPアルゴリズム(状態系列単位)( 2/2 ) (13)
近似アルゴリズム(状態系列単位)( 1/2 ) 学習データに対する事後分布による予測分布を未知パラメータの推定値として採用し,ビタビアルゴリズムで状態系列を推定する 学習データに対する事後分布による  の予測分布 も同様 従来研究と同様にパラメータの推定問題と状態系列の推定問題という二つの問題に分割して検討していることになる ->  しかし,ベイズ最適な推定方法を導出する際に出てきた事後分布による予測分布を未知パラメータの推定値として採用しており,推定方法の採用には統計的決定理論に基づく根拠がある ベイズ解における新規系列による頻度更新を無視することに相当 . (14)
トレリス線図の例      の場合 時点 時点 時点 時点 時点 時点のメトリック(  時点の状態  から  時点の状態  への枝に付与) 時点から  時点まで各時点ごとにトレリス線図上の全状態について次式によって計算(  時点から  時点の状態  までの最尤系列) 学習データに対する事後分布による予測分布を用いた場合の最尤系列を求められる.計算量は系列長に比例 . . 近似アルゴリズム(状態系列単位)( 2/2 ) (15) (16)
定式化とベイズ解(状態単位) 損失関数 ただし,  は学習データと新規の記号系列を受け取ったもとで状態  の推定結果を返す決定関数 ベイズ最適な決定 . ベイズ基準のもとで状態の推定を間違えてしまう確率である誤り率を最小にする決定は可能だが,計算量は系列長に対する指数オーダ ->  近似アルゴリズムの検討 (17) (18)
近似アルゴリズム(状態単位)( 1/2 ) 学習データに対する事後分布による予測分布を未知パラメータの推定値として採用し, BCJR アルゴリズムで状態を推定する . . . (19) (20) (21)
近似アルゴリズム(状態単位)( 2/2 ) . . および  は以下のように再帰的に計算される 近似解 時点 時点 時点 時点 時点 時点 時点 近似アルゴリズムの計算量は系列長に比例 (22) (23)
定式化とベイズ解(状態の有無) 損失関数 ただし,  は系列  中に状態  が有れば  ,無ければ  を返す関数 ベイズ最適な決定 この場合の近似アルゴリズムは BCJR アルゴリズムを利用して導出できる ただし,  は状態  が系列  中に無い確率の推定値 . (24) (25) (26)
まとめ 未知パラメータを伴う隠れマルコフモデルの状態推定問題を  ・状態系列単位で評価する場合 ・状態単位で評価する場合  ・状態の有無で評価する場合 という目的別に定式化を実施 状態系列単位で評価する推定問題について  ・統計的決定理論に基づきベイズ基準のもとで誤り率を最小にするベイズ決定の導出  ・動的計画法によってベイズ決定を行うアルゴリズムの提案  ・学習データに対する事後分布による予測分布を用いた近似アルゴリズムの提案(ビタビアルゴリズムを適用) 状態単位で評価する推定問題について  ・統計的決定理論に基づきベイズ基準のもとで誤り率を最小にするベイズ決定の導出  ・学習データに対する事後分布による予測分布を用いた近似アルゴリズムの提案(BCJRアルゴリズムを適用) 状態の有無で評価する推定問題について  ・統計的決定理論に基づきベイズ基準のもとで誤り率を最小にするベイズ決定の導出
今後の課題 形態素解析等の実データでの検証 本研究が応用可能な実問題の模索 ベイズ最適な推定方法の計算量の軽減

Mais conteúdo relacionado

Destaque

第2回ぞくパタ
第2回ぞくパタ第2回ぞくパタ
第2回ぞくパタAkifumi Eguchi
 
続分かりやすいパターン認識 4章後半(4.7以降)
続分かりやすいパターン認識 4章後半(4.7以降)続分かりやすいパターン認識 4章後半(4.7以降)
続分かりやすいパターン認識 4章後半(4.7以降)Motoya Wakiyama
 
続・わかりやすいパターン認識第5章
続・わかりやすいパターン認識第5章続・わかりやすいパターン認識第5章
続・わかりやすいパターン認識第5章Roy Ray
 
金融ビッグデータと人工知能技術III 人工市場による市場制度の設計 2015
金融ビッグデータと人工知能技術III 人工市場による市場制度の設計 2015金融ビッグデータと人工知能技術III 人工市場による市場制度の設計 2015
金融ビッグデータと人工知能技術III 人工市場による市場制度の設計 2015Takanobu Mizuta
 
続・わかりやすいパターン認識4章(関西機械学習勉強会発表スライド)
続・わかりやすいパターン認識4章(関西機械学習勉強会発表スライド)続・わかりやすいパターン認識4章(関西機械学習勉強会発表スライド)
続・わかりやすいパターン認識4章(関西機械学習勉強会発表スライド)Eriko Nomoto
 
Nl220 Pitman-Yor Hidden Semi Markov Model
Nl220 Pitman-Yor Hidden Semi Markov ModelNl220 Pitman-Yor Hidden Semi Markov Model
Nl220 Pitman-Yor Hidden Semi Markov ModelKei Uchiumi
 
#みどりぼん 11章「空間構造のある階層ベイズモデル」後半
#みどりぼん 11章「空間構造のある階層ベイズモデル」後半#みどりぼん 11章「空間構造のある階層ベイズモデル」後半
#みどりぼん 11章「空間構造のある階層ベイズモデル」後半Katsushi Yamashita
 
【02】ゼロから始める経済学_経済学の考え方ー競争篇
【02】ゼロから始める経済学_経済学の考え方ー競争篇【02】ゼロから始める経済学_経済学の考え方ー競争篇
【02】ゼロから始める経済学_経済学の考え方ー競争篇
 
金融ビッグデータと人工知能技術III 人工市場による市場制度の設計: 東京大学公共政策大学院 集中講義 「経済物理学」 第7回(2016/8/5)
金融ビッグデータと人工知能技術III  人工市場による市場制度の設計: 東京大学公共政策大学院 集中講義 「経済物理学」 第7回(2016/8/5)金融ビッグデータと人工知能技術III  人工市場による市場制度の設計: 東京大学公共政策大学院 集中講義 「経済物理学」 第7回(2016/8/5)
金融ビッグデータと人工知能技術III 人工市場による市場制度の設計: 東京大学公共政策大学院 集中講義 「経済物理学」 第7回(2016/8/5)Takanobu Mizuta
 
DSIRNLP06 Nested Pitman-Yor Language Model
DSIRNLP06 Nested Pitman-Yor Language ModelDSIRNLP06 Nested Pitman-Yor Language Model
DSIRNLP06 Nested Pitman-Yor Language ModelKei Uchiumi
 
Deep Learning Chapter12
Deep Learning Chapter12Deep Learning Chapter12
Deep Learning Chapter12Kei Uchiumi
 
ベイズ Chow-Liu アルゴリズム
ベイズ Chow-Liu アルゴリズムベイズ Chow-Liu アルゴリズム
ベイズ Chow-Liu アルゴリズムJoe Suzuki
 
合コンで学ぶベイズ推定
合コンで学ぶベイズ推定合コンで学ぶベイズ推定
合コンで学ぶベイズ推定Kenta Matsui
 
みどりぼん第11回 前半
みどりぼん第11回 前半みどりぼん第11回 前半
みどりぼん第11回 前半Atsushi Hayakawa
 
続・わかりやすいパターン認識 第7章「マルコフモデル」
続・わかりやすいパターン認識 第7章「マルコフモデル」続・わかりやすいパターン認識 第7章「マルコフモデル」
続・わかりやすいパターン認識 第7章「マルコフモデル」T T
 
概要と具体例で学ぶHMM(隠れマルコフモデル)
概要と具体例で学ぶHMM(隠れマルコフモデル)概要と具体例で学ぶHMM(隠れマルコフモデル)
概要と具体例で学ぶHMM(隠れマルコフモデル)thinkn1108
 
データ解析で割安賃貸物件を探せ!(山手線沿線編) LT
データ解析で割安賃貸物件を探せ!(山手線沿線編) LTデータ解析で割安賃貸物件を探せ!(山手線沿線編) LT
データ解析で割安賃貸物件を探せ!(山手線沿線編) LT. .
 
階層ベイズによるワンToワンマーケティング入門
階層ベイズによるワンToワンマーケティング入門階層ベイズによるワンToワンマーケティング入門
階層ベイズによるワンToワンマーケティング入門shima o
 

Destaque (20)

第2回ぞくパタ
第2回ぞくパタ第2回ぞくパタ
第2回ぞくパタ
 
続分かりやすいパターン認識 4章後半(4.7以降)
続分かりやすいパターン認識 4章後半(4.7以降)続分かりやすいパターン認識 4章後半(4.7以降)
続分かりやすいパターン認識 4章後半(4.7以降)
 
続・わかりやすいパターン認識第5章
続・わかりやすいパターン認識第5章続・わかりやすいパターン認識第5章
続・わかりやすいパターン認識第5章
 
20110221
2011022120110221
20110221
 
金融ビッグデータと人工知能技術III 人工市場による市場制度の設計 2015
金融ビッグデータと人工知能技術III 人工市場による市場制度の設計 2015金融ビッグデータと人工知能技術III 人工市場による市場制度の設計 2015
金融ビッグデータと人工知能技術III 人工市場による市場制度の設計 2015
 
続・わかりやすいパターン認識4章(関西機械学習勉強会発表スライド)
続・わかりやすいパターン認識4章(関西機械学習勉強会発表スライド)続・わかりやすいパターン認識4章(関西機械学習勉強会発表スライド)
続・わかりやすいパターン認識4章(関西機械学習勉強会発表スライド)
 
Nl220 Pitman-Yor Hidden Semi Markov Model
Nl220 Pitman-Yor Hidden Semi Markov ModelNl220 Pitman-Yor Hidden Semi Markov Model
Nl220 Pitman-Yor Hidden Semi Markov Model
 
#みどりぼん 11章「空間構造のある階層ベイズモデル」後半
#みどりぼん 11章「空間構造のある階層ベイズモデル」後半#みどりぼん 11章「空間構造のある階層ベイズモデル」後半
#みどりぼん 11章「空間構造のある階層ベイズモデル」後半
 
【02】ゼロから始める経済学_経済学の考え方ー競争篇
【02】ゼロから始める経済学_経済学の考え方ー競争篇【02】ゼロから始める経済学_経済学の考え方ー競争篇
【02】ゼロから始める経済学_経済学の考え方ー競争篇
 
Dsirnlp#7
Dsirnlp#7Dsirnlp#7
Dsirnlp#7
 
金融ビッグデータと人工知能技術III 人工市場による市場制度の設計: 東京大学公共政策大学院 集中講義 「経済物理学」 第7回(2016/8/5)
金融ビッグデータと人工知能技術III  人工市場による市場制度の設計: 東京大学公共政策大学院 集中講義 「経済物理学」 第7回(2016/8/5)金融ビッグデータと人工知能技術III  人工市場による市場制度の設計: 東京大学公共政策大学院 集中講義 「経済物理学」 第7回(2016/8/5)
金融ビッグデータと人工知能技術III 人工市場による市場制度の設計: 東京大学公共政策大学院 集中講義 「経済物理学」 第7回(2016/8/5)
 
DSIRNLP06 Nested Pitman-Yor Language Model
DSIRNLP06 Nested Pitman-Yor Language ModelDSIRNLP06 Nested Pitman-Yor Language Model
DSIRNLP06 Nested Pitman-Yor Language Model
 
Deep Learning Chapter12
Deep Learning Chapter12Deep Learning Chapter12
Deep Learning Chapter12
 
ベイズ Chow-Liu アルゴリズム
ベイズ Chow-Liu アルゴリズムベイズ Chow-Liu アルゴリズム
ベイズ Chow-Liu アルゴリズム
 
合コンで学ぶベイズ推定
合コンで学ぶベイズ推定合コンで学ぶベイズ推定
合コンで学ぶベイズ推定
 
みどりぼん第11回 前半
みどりぼん第11回 前半みどりぼん第11回 前半
みどりぼん第11回 前半
 
続・わかりやすいパターン認識 第7章「マルコフモデル」
続・わかりやすいパターン認識 第7章「マルコフモデル」続・わかりやすいパターン認識 第7章「マルコフモデル」
続・わかりやすいパターン認識 第7章「マルコフモデル」
 
概要と具体例で学ぶHMM(隠れマルコフモデル)
概要と具体例で学ぶHMM(隠れマルコフモデル)概要と具体例で学ぶHMM(隠れマルコフモデル)
概要と具体例で学ぶHMM(隠れマルコフモデル)
 
データ解析で割安賃貸物件を探せ!(山手線沿線編) LT
データ解析で割安賃貸物件を探せ!(山手線沿線編) LTデータ解析で割安賃貸物件を探せ!(山手線沿線編) LT
データ解析で割安賃貸物件を探せ!(山手線沿線編) LT
 
階層ベイズによるワンToワンマーケティング入門
階層ベイズによるワンToワンマーケティング入門階層ベイズによるワンToワンマーケティング入門
階層ベイズによるワンToワンマーケティング入門
 

Semelhante a ma52006id384

Data assim r
Data assim rData assim r
Data assim rXiangze
 
状態空間モデルの実行方法と実行環境の比較
状態空間モデルの実行方法と実行環境の比較状態空間モデルの実行方法と実行環境の比較
状態空間モデルの実行方法と実行環境の比較Hiroki Itô
 
[PRML] パターン認識と機械学習(第1章:序論)
[PRML] パターン認識と機械学習(第1章:序論)[PRML] パターン認識と機械学習(第1章:序論)
[PRML] パターン認識と機械学習(第1章:序論)Ryosuke Sasaki
 
不均衡データのクラス分類
不均衡データのクラス分類不均衡データのクラス分類
不均衡データのクラス分類Shintaro Fukushima
 
【学会発表】LDAにおけるベイズ汎化誤差の厳密な漸近形【IBIS2020】
【学会発表】LDAにおけるベイズ汎化誤差の厳密な漸近形【IBIS2020】【学会発表】LDAにおけるベイズ汎化誤差の厳密な漸近形【IBIS2020】
【学会発表】LDAにおけるベイズ汎化誤差の厳密な漸近形【IBIS2020】Naoki Hayashi
 
行列およびテンソルデータに対する機械学習(数理助教の会 2011/11/28)
行列およびテンソルデータに対する機械学習(数理助教の会 2011/11/28)行列およびテンソルデータに対する機械学習(数理助教の会 2011/11/28)
行列およびテンソルデータに対する機械学習(数理助教の会 2011/11/28)ryotat
 
PRML読み会第一章
PRML読み会第一章PRML読み会第一章
PRML読み会第一章Takushi Miki
 
Fisher Vectorによる画像認識
Fisher Vectorによる画像認識Fisher Vectorによる画像認識
Fisher Vectorによる画像認識Takao Yamanaka
 
ISMB読み会 2nd graph kernel
ISMB読み会 2nd graph kernelISMB読み会 2nd graph kernel
ISMB読み会 2nd graph kernel弘毅 露崎
 
【招待講演】パラメータ制約付き行列分解のベイズ汎化誤差解析【StatsML若手シンポ2020】
【招待講演】パラメータ制約付き行列分解のベイズ汎化誤差解析【StatsML若手シンポ2020】【招待講演】パラメータ制約付き行列分解のベイズ汎化誤差解析【StatsML若手シンポ2020】
【招待講演】パラメータ制約付き行列分解のベイズ汎化誤差解析【StatsML若手シンポ2020】Naoki Hayashi
 
信号処理・画像処理における凸最適化
信号処理・画像処理における凸最適化信号処理・画像処理における凸最適化
信号処理・画像処理における凸最適化Shunsuke Ono
 
Rで計量時系列分析~CRANパッケージ総ざらい~
Rで計量時系列分析~CRANパッケージ総ざらい~ Rで計量時系列分析~CRANパッケージ総ざらい~
Rで計量時系列分析~CRANパッケージ総ざらい~ Takashi J OZAKI
 
Normalization of microarray
Normalization of microarrayNormalization of microarray
Normalization of microarray弘毅 露崎
 

Semelhante a ma52006id384 (20)

ma52005id336
ma52005id336ma52005id336
ma52005id336
 
Data assim r
Data assim rData assim r
Data assim r
 
状態空間モデルの実行方法と実行環境の比較
状態空間モデルの実行方法と実行環境の比較状態空間モデルの実行方法と実行環境の比較
状態空間モデルの実行方法と実行環境の比較
 
Ibisml vhmm
Ibisml vhmmIbisml vhmm
Ibisml vhmm
 
[PRML] パターン認識と機械学習(第1章:序論)
[PRML] パターン認識と機械学習(第1章:序論)[PRML] パターン認識と機械学習(第1章:序論)
[PRML] パターン認識と機械学習(第1章:序論)
 
不均衡データのクラス分類
不均衡データのクラス分類不均衡データのクラス分類
不均衡データのクラス分類
 
【学会発表】LDAにおけるベイズ汎化誤差の厳密な漸近形【IBIS2020】
【学会発表】LDAにおけるベイズ汎化誤差の厳密な漸近形【IBIS2020】【学会発表】LDAにおけるベイズ汎化誤差の厳密な漸近形【IBIS2020】
【学会発表】LDAにおけるベイズ汎化誤差の厳密な漸近形【IBIS2020】
 
Tokyo r #43
Tokyo r #43Tokyo r #43
Tokyo r #43
 
Paper: seq2seq 20190320
Paper: seq2seq 20190320Paper: seq2seq 20190320
Paper: seq2seq 20190320
 
Jokyokai
JokyokaiJokyokai
Jokyokai
 
行列およびテンソルデータに対する機械学習(数理助教の会 2011/11/28)
行列およびテンソルデータに対する機械学習(数理助教の会 2011/11/28)行列およびテンソルデータに対する機械学習(数理助教の会 2011/11/28)
行列およびテンソルデータに対する機械学習(数理助教の会 2011/11/28)
 
PRML読み会第一章
PRML読み会第一章PRML読み会第一章
PRML読み会第一章
 
Maeshori missing
Maeshori missingMaeshori missing
Maeshori missing
 
Fisher Vectorによる画像認識
Fisher Vectorによる画像認識Fisher Vectorによる画像認識
Fisher Vectorによる画像認識
 
ISMB読み会 2nd graph kernel
ISMB読み会 2nd graph kernelISMB読み会 2nd graph kernel
ISMB読み会 2nd graph kernel
 
【招待講演】パラメータ制約付き行列分解のベイズ汎化誤差解析【StatsML若手シンポ2020】
【招待講演】パラメータ制約付き行列分解のベイズ汎化誤差解析【StatsML若手シンポ2020】【招待講演】パラメータ制約付き行列分解のベイズ汎化誤差解析【StatsML若手シンポ2020】
【招待講演】パラメータ制約付き行列分解のベイズ汎化誤差解析【StatsML若手シンポ2020】
 
PRML Chapter 14
PRML Chapter 14PRML Chapter 14
PRML Chapter 14
 
信号処理・画像処理における凸最適化
信号処理・画像処理における凸最適化信号処理・画像処理における凸最適化
信号処理・画像処理における凸最適化
 
Rで計量時系列分析~CRANパッケージ総ざらい~
Rで計量時系列分析~CRANパッケージ総ざらい~ Rで計量時系列分析~CRANパッケージ総ざらい~
Rで計量時系列分析~CRANパッケージ総ざらい~
 
Normalization of microarray
Normalization of microarrayNormalization of microarray
Normalization of microarray
 

Mais de matsushimalab (20)

ma99992012id537
ma99992012id537ma99992012id537
ma99992012id537
 
ma12012id536
ma12012id536ma12012id536
ma12012id536
 
ma112011id535
ma112011id535ma112011id535
ma112011id535
 
ma99992010id512
ma99992010id512ma99992010id512
ma99992010id512
 
ma99992010id510
ma99992010id510ma99992010id510
ma99992010id510
 
ma99992011id509
ma99992011id509ma99992011id509
ma99992011id509
 
ma99992011id508
ma99992011id508ma99992011id508
ma99992011id508
 
ma99992010id497
ma99992010id497ma99992010id497
ma99992010id497
 
ma99992010id464
ma99992010id464ma99992010id464
ma99992010id464
 
ma92010id461
ma92010id461ma92010id461
ma92010id461
 
ma112010id450
ma112010id450ma112010id450
ma112010id450
 
ma112009id434
ma112009id434ma112009id434
ma112009id434
 
ma52009id421
ma52009id421ma52009id421
ma52009id421
 
ma52009id420
ma52009id420ma52009id420
ma52009id420
 
ma52009id419
ma52009id419ma52009id419
ma52009id419
 
ma112007id414
ma112007id414ma112007id414
ma112007id414
 
ma112007id413
ma112007id413ma112007id413
ma112007id413
 
ma22006id411
ma22006id411ma22006id411
ma22006id411
 
ma112006id337
ma112006id337ma112006id337
ma112006id337
 
ma92007id395
ma92007id395ma92007id395
ma92007id395
 

ma52006id384

  • 1. 未知パラメータを伴う 隠れマルコフモデルの状態推定 に関する一考察 前田 康成 (北見工業大学工学部) 吉田 秀樹 (北見工業大学工学部) 藤原 祥隆 (北見工業大学工学部) 松嶋 敏泰 (早稲田大学理工学部)
  • 2.  本日の発表内容 未知パラメータを伴う隠れマルコフモデルの状態推定問題の概要 準備 従来研究 未知パラメータを伴う隠れマルコフモデルの状態推定の目的の整理 状態系列単位で評価する場合 ・定式化 ・ベイズ基準のもとで誤り率を最小にする推定方法 ・ベイズ解を求める DP アルゴリズム ・近似アルゴリズム 状態単位で評価する場合 ・定式化 ・ベイズ基準のもとで誤り率を最小にする推定方法 ・近似アルゴリズム 状態の有無に関して評価する場合 ・定式化 ・ベイズ基準のもとで誤り率を最小にする推定方法 まとめと今後の課題
  • 3.   隠れマルコフモデル( HMM )の概要 状態 から状態 への遷移確率 状態 での記号 の生起確率 状態 記号 初期状態が生起し,記号の生起と状態遷移を繰り返す 通常,状態系列は未知で,記号系列が観測される 初期状態 の生起確率
  • 4. 未知パラメータを伴う隠れマルコフモデルの状態推定問題 確率分布を支配するパラメータが未知のもとで,学習データを用いて学習し, 新規の記号系列を観測して,新規の記号系列に対応する未知の状態系列を 推定する問題 単語系列を観測して,品詞系列を推定  -> 形態素解析 単語系列を観測して,クラス系列を推定  -> 複数のクラスに属する文書のクラスの推定 【応用例】 複数のクラスに属する文書の生成 単語 文書のクラス 文の生成 単語 品詞 表現するもの 記号 状態
  • 5.  準備( 1/2 ) 状態 状態集合 記号 記号の集合 状態 が生起する確率分布( HMM の初期状態の生起確率) 状態 で記号 が生起する確率分布 を支配するパラメータ 真のパラメータ(未知) 状態 から状態 へ遷移する確率を示す確率分布 ( HMM の状態の遷移確率) を支配するパラメータ
  • 6.  準備( 2/2 ) 学習データの 番目の系列 番目の系列の 番目の状態 番目の系列の 番目の記号 番目の系列の状態および記号の数 個の学習データ(状態系列 ,記号系列 ともに既知) 新規に状態系列を推定したい系列の組 学習データ と新規の記号系列 を受け取ったもとで, 新規の記号系列に対応する状態系列 を推定する問題 未知パラメータを伴う隠れマルコフモデルの状態推定問題 学習データ 新規のデータ (状態系列 は未知,記号系列 は既知)
  • 7.  従来研究における学習と推定方法 従来研究では未知パラメータの推定(学習)と状態推定が二つの問題に分けて検討されている 未知パラメータの推定 状態推定 最尤学習 漸近的に真のパラメータに収束することは保証されているが,有限の学習データに対して何故この推定方法を採用するかという根拠が不明確 真のパラメータ既知の場合に誤り率を最小にする推定方法に推定値を代入 -> 推定値次第 本研究では統計的決定理論の視点から未知パラメータの推定と状態推定を一つの統計的決定問題として検討する . . . (1) (2) (3)
  • 8.  状態推定の目的の整理 状態 の推定結果 ・単語単位で評価する形態素解析 ・複数のクラスに属する文書の分類及びインデックスの付与 状態 単位で評価 状態系列 中に状態 が含まれるかどうかの推定結果 系列 の推定結果 出力      学習データ     新規の記号系列 入力 ・複数のクラスに属する文書の分類 ・文単位で評価する形態素解析 ・複数のクラスに属する文書の分類及びインデックス付与 用途 状態 の有無に関して評価 状態系列 単位で評価
  • 9. 定式化(状態系列単位)( 1/2 ) 損失関数 ただし, は学習データと新規の記号系列を受け取ったもとで状態系列の推定結果を返す決定関数 リスク関数 . (4) (5)
  • 10. ベイズリスク ただし, は事前分布 ベイズ最適な決定関数 . . 定式化(状態系列単位)( 2/2 ) (6) (7)
  • 11. ベイズ決定(状態系列単位)( 1/3 ) ベイズ最適な決定 ベイズ基準のもとで状態系列の推定を間違えてしまう確率である誤り率を 最小にする決定 事前分布に共役事前分布であるディレクレ分布を採用することにより積分部分はディレクレ分布のパラメータと頻度情報によって算出可能 . (8)
  • 12. 事前分布に共役事前分布であるディレクレ分布を採用した場合 学習データの各状態系列中で最初の状態が の数 に対するディレクレ分布のパラメータ ただし, 学習データ中で状態 で記号 が生起した回数 に対するディレクレ分布のパラメータ ただし, , , ベイズ決定(状態系列単位)( 2/3 ) (9) (10)
  • 13. 学習データ中で状態 から状態 へ遷移した回数 に対するディレクレ分布のパラメータ ただし, 系列 で状態 で記号 が生起した回数 ただし, , , ベイズ決定(状態系列単位)( 3/3 ) (11) (12)
  • 14. ベイズ解を求めるDPアルゴリズム(状態系列単位)( 1/2 ) 新規の記号系列に対応する状態系列の候補を木構造で列挙して,動的計画法(DP)を用いてベイズ解を求める 例     の場合 空列のノード 個 個 深さ 個 各ノードにその系列に対応する事後分布を保持させて,動的計画法を用いて,深さ のノードから遡ってベイズ最適な系列を推定する
  • 15. 木の末端から以下の処理を再帰的に繰り返すことによって,ベイズ最適な系列が推定できる は,ノード における部分最適解の確率 ただし, 上式で定まる部分最適解の確率,系列をそれぞれ保持しておいて, 深さ のノードで部分最適解として利用する 深さ の各ノードでの計算 ベイズ最適な系列の推定は可能だが,計算量はノード数に比例し, 系列長に対する指数オーダになる , ベイズ解を求めるDPアルゴリズム(状態系列単位)( 2/2 ) (13)
  • 16. 近似アルゴリズム(状態系列単位)( 1/2 ) 学習データに対する事後分布による予測分布を未知パラメータの推定値として採用し,ビタビアルゴリズムで状態系列を推定する 学習データに対する事後分布による の予測分布 も同様 従来研究と同様にパラメータの推定問題と状態系列の推定問題という二つの問題に分割して検討していることになる ->  しかし,ベイズ最適な推定方法を導出する際に出てきた事後分布による予測分布を未知パラメータの推定値として採用しており,推定方法の採用には統計的決定理論に基づく根拠がある ベイズ解における新規系列による頻度更新を無視することに相当 . (14)
  • 17. トレリス線図の例     の場合 時点 時点 時点 時点 時点 時点のメトリック( 時点の状態 から 時点の状態 への枝に付与) 時点から 時点まで各時点ごとにトレリス線図上の全状態について次式によって計算( 時点から 時点の状態 までの最尤系列) 学習データに対する事後分布による予測分布を用いた場合の最尤系列を求められる.計算量は系列長に比例 . . 近似アルゴリズム(状態系列単位)( 2/2 ) (15) (16)
  • 18. 定式化とベイズ解(状態単位) 損失関数 ただし, は学習データと新規の記号系列を受け取ったもとで状態 の推定結果を返す決定関数 ベイズ最適な決定 . ベイズ基準のもとで状態の推定を間違えてしまう確率である誤り率を最小にする決定は可能だが,計算量は系列長に対する指数オーダ ->  近似アルゴリズムの検討 (17) (18)
  • 19. 近似アルゴリズム(状態単位)( 1/2 ) 学習データに対する事後分布による予測分布を未知パラメータの推定値として採用し, BCJR アルゴリズムで状態を推定する . . . (19) (20) (21)
  • 20. 近似アルゴリズム(状態単位)( 2/2 ) . . および は以下のように再帰的に計算される 近似解 時点 時点 時点 時点 時点 時点 時点 近似アルゴリズムの計算量は系列長に比例 (22) (23)
  • 21. 定式化とベイズ解(状態の有無) 損失関数 ただし, は系列 中に状態 が有れば ,無ければ を返す関数 ベイズ最適な決定 この場合の近似アルゴリズムは BCJR アルゴリズムを利用して導出できる ただし, は状態 が系列 中に無い確率の推定値 . (24) (25) (26)
  • 22. まとめ 未知パラメータを伴う隠れマルコフモデルの状態推定問題を  ・状態系列単位で評価する場合 ・状態単位で評価する場合  ・状態の有無で評価する場合 という目的別に定式化を実施 状態系列単位で評価する推定問題について  ・統計的決定理論に基づきベイズ基準のもとで誤り率を最小にするベイズ決定の導出  ・動的計画法によってベイズ決定を行うアルゴリズムの提案  ・学習データに対する事後分布による予測分布を用いた近似アルゴリズムの提案(ビタビアルゴリズムを適用) 状態単位で評価する推定問題について  ・統計的決定理論に基づきベイズ基準のもとで誤り率を最小にするベイズ決定の導出  ・学習データに対する事後分布による予測分布を用いた近似アルゴリズムの提案(BCJRアルゴリズムを適用) 状態の有無で評価する推定問題について  ・統計的決定理論に基づきベイズ基準のもとで誤り率を最小にするベイズ決定の導出