SlideShare uma empresa Scribd logo
1 de 41
Baixar para ler offline
第2回PRML読書会復讐レーン
2.3.6 ガウス分布に対するベイズ
          推論
        2010/05/08
    Presented by takmin
おさらい
• ガウス分布(1次元)
                     
  p( x |  ,  )  N x |  ,  2   
                         1            1                
                                 exp      ( x   )2 
                   (2 2 )1/ 2        2 2            
                   正規化係数                   二次形式
        




        μ                x
おさらい
• ガウス分布(D次元)
p(x | μ, Σ)  N x | μ, Σ 
                 1       1         1       T 1      
                              exp (x  μ) Σ (x  μ)
              (2 ) D/2
                        Σ
                          1/ 2
                                   2                 
                 正規化係数              二次形式
           Σ



            μ            x
おさらい
• 最尤推定
             N
  p(x | θ)   p( xn | θ)
  尤度        n 1
                 観測データ   パラメータ
                 サンプル

データが観測されたとき,そのデータが発生する確
率(尤度)を最大化するパラメータを求めること
おさらい
• ベイズ推論
            p(x | θ) p(θ)
 p(θ | x) 
               p ( x)
 事後分布
                                N
          p(x | θ) p(θ)  p(θ) p( xn | θ)
                               n 1
              尤度    事前分布

データが観測されたとき,パラメータがとる確率分布
を求める
この節の流れ
ガウス分布の各パラメータの事後分布を求める

1. 平均が未知の場合のベイズ推論
2. 分散が未知の場合のベイズ推論
3. 平均と分散が未知の場合のベイズ推論
    
           今回はとにかく数式だらけ!


    μ
平均が未知の場合
平均の事後分布:
      p( | x)  p(x |  ) p( )
尤度関数:
               N                  N
  p ( x |  )   p ( xn |  )   N ( x n |  ,  2 )   μについてもガウス
                                                         分布になっている
               n 1              n 1

                      1     1              N
                                                        
           
             (2 )
                 2 N /2
                        exp 2
                            2
                                            ( xn   ) 
                                           n 1         
                                                         2
                                                             (2.137)



   何か事前分布を仮定してやる必要がある
平均が未知の場合
試しに平均の事前分布もガウス分布で表わしてみる

事前分布:

               p( )  N  | 0 ,         2
                                            0   
事後分布:

                                                     N x
                                                      N
p (  | x)  p ( x |  ) p (  )  N  |  0 ,  0
                                                 2
                                                             n   | , 
                                                     n 1
                                                            (2.138)+(2.139)
平均が未知の場合
演習 2.38

                                      N x
                                       N
p(x |  ) p(  )  N  | 0 ,    2
                                  0             n   |  , 
                                      n 1

          1                1           2      1           1 N            2
                     exp 2 (   0 )              exp 2  ( xn   ) 
    (2 0 )2 1/ 2
                           2 0          (2 )
                                                 2 N /2
                                                            2 n 1         
               1                 1                1 N          2
                           exp 2 (   0 )  2  ( xn   ) 
                                              2

    (2 ) ( N 1) / 2
                       0
                        N
                                 2 0            2 n 1        
                                             ここだけ取り出して計算
平均が未知の場合
演習 2.38 (続き)
                                 N
      1                    1
 
     2 0
        2
            (  0 ) 
                    2

                          2 2
                                  ( xn   ) 2
                                 n 1

         N    1  2  1                    N
                                                       1  
       2 
         2          2
                 2 
              2 0                        xn   2 0   const
                                                          
                                          n 1     0    
         N    1  2  2 0 2                         N
                                                               2 2        
       2 
         2          2
                 2 
              2 0     N  2                    xn   2 N   2 0    const
                                                                          
                        0                         n 1     0             
                            xn    0 
                                                            2
               1 
                                        2          2
         N
       2 
         2         
                 2 
                                        0
                                           const
              2 0        0 N 
                             2      2    
                                        
         1      
       2
         2        N 2  const
                                                          平方完成!
         N      
平均が未知の場合
演習 2.38 (続き)

 事後分布は

                                  
             p( | x)  N  |  N ,             2
                                                 N                           (2.140)



 ただし,

       2              N 02                     1           1           N
N             0              ML                                
     N 0  
        2     2
                     N 0  
                        2     2
                                       (2.141)      2
                                                     N          2
                                                                 0       2      (2.142)

             N
         1
 ML   
         N
             x
             n 1
                    n
                        (2.143)
平均が未知の場合
まとめると
       p( | x)  p(x |  ) p( )

 N  |  N ,    2
                  N       N
                                                 N  | 0 ,    2
                                                                 0   
                           N ( xn |  ,  2 )
                          n 1



尤度関数、事前分布、事後分布がみんな平均μにつ
いてのガウス分布になった!
平均が未知の場合

共役事前分布:
尤度関数と同じ関数型の事前分布で,事
後分布を同じ関数型にする事前分布

この節の残りでは,同じようなやり方を分散が未知の
場合や平均と分散の両方が未知の場合に適用して
るだけ
結論
ガウス分布に対する,平均及び分散の共役事前
分布は以下のようにまとめられる

      平均が未知   分散が未知   平均と分散が
                      未知
1次元   ガウス分布   ガンマ分布   ガウス-ガンマ
                      分布
D次元   ガウス分布   ウィシャート分 ガウス-ウィ
              布       シャート分布
平均が未知の場合
平均の事後分布:

                               
              p( | x)  N  |  N ,    2
                                         N   
       2              N 02
                                         1           1           N
N             0              ML                        
     N 0  
        2     2
                     N 0  
                        2     2
                                          2
                                           N            2
                                                         0       2
N=0の時、
      N  0        N  0

観測データがない場合,事後分布=事前分布
平均が未知の場合
平均の事後分布:

                              
              p( | x)  N  |  N ,    2
                                         N   
       2              N 02
                                         1           1           N
N             0              ML                        
     N 0  
        2     2
                     N 0  
                        2     2
                                          2
                                           N            2
                                                         0       2
N→∞の時、
   N   ML        N  0

観測データ多いと事後分布は最尤推定解に近づく
平均が未知の場合
データ数と平均の事後分布の関係:
平均が未知の場合
      D次元ガウス分布の場合(演習2.40):

                                 N                                N
p ( X | μ) p (μ)  p (μ) p(x n | μ)  N μ | μ 0 , Σ 0  N x n | μ, Σ 
                                n 1                              n 1

              1                1              1                           1 N                          
                                         exp (μ  μ 0 ) Σ 0 (μ  μ 0 )   (x n  μ) T Σ 1 (x n  μ)
                                                          T  1

      (2 ) ( N 1) D / 2 Σ ( N 1) / 2       2                           2 n 1                       
平均が未知の場合
    D次元ガウス分布の場合(演習2.40):
 1                           1 N
 (μ  μ 0 ) Σ 0 (μ  μ 0 )   (x n  μ) T Σ 1 (x n  μ)
            T 1

 2                           2 n 1
     1 T 1
     2
               1  1 T 1
                    2
                               1 T 1      1 N T 1
                                                                
    μ Σ 0  NΣ μ  μ Σ 0 μ 0  μ 0 Σ 0 μ   μ Σ x n  μΣ1x T  const
                                2           2 n 1
                                                               n               
                      T  1                
                              
                                        N
     1 T 1
    μ Σ 0  NΣ μ  μ  Σ 0 μ 0  Σ  x n   const
                1                  1

     2                                n 1 
       1
       μ  μ N T Σ 1 μ  μ N   const
                       N
       2
 ただし
               1
     μ N  Σ  NΣ
                0            Σ
                          1 1    1
                                   0
                                          1
                                    μ 0  Σ μ ML      μ ML   
                                                                1   N

                                                                    x     n
                                                                N
           Σ               
                                                                    n 1
                 1
     ΣN          0     NΣ1
平均が未知の場合
逐次更新式:
                  N
p(  | x)  p(  ) p( xn |  )
                 n 1


                 N 1
                               
          p(  ) p( xn |  ) p( xN |  )
                 n 1                        (2.144)

             新たな事前分布とみなす
分散が未知の場合
                             1
分散の代わりに精度を用いる  
                             2
         p( | x)  p(x |  ) p( )
尤度関数:
          N
                                         N         2
p(x |  )   N ( xn |  ,  )   exp  ( xn   ) 
                            1    N /2

            n 1                        2 n1        
                                                     (2.145)
共役事前分布:                       λについて同じ関数形!
                          1 a a 1
 p( )  Gam( | a, b)       b  exp( b )
                         (a)                        (2.146)

           ガンマ分布
分散が未知の場合
演習2.41
                         1 a a 1
       Gam(  | a, b)         b  exp( b )
                        ( a )
 が、正規化されていることを証明
    1 a a 1                b 
0 (a)  b  exp(b )d 
                            (a) 0
                                    (b ) a 1 exp( b )d

                           1
      z  b とおくと、 d  dz なので、
                           b
   b                          1  a 1
       0 (b ) exp(b )d  (a) 0 z exp( z)dz
               a 1

  (a)
分散が未知の場合
演習2.41 (続き)
          
  (a)   u a 1 exp( u)du
          0


 なので、
   1  a 1
  (a) 0 z exp( z)dz  1
 よって正規化されている。
分散が未知の場合
ガンマ分布:
                  1 a a 1
Gam(  | a, b)         b  exp( b )
                 ( a )
分散が未知の場合
ガンマ分布の期待値(演習 2.42)
                                     
E[ ]    Gam(  | a, b)d             b a a 1 exp( b )d
        0                      0 ( a )
                                    1
           z  b とおくと、 d  dz なので、
                                    b
                              1 1  a
        Gam(  | a, b)d           0 z exp( z)dz
        0                     ( a ) b
       (a  1) a(a) a
                       
        b(a)     b(a) b
            演習1.17参照
分散が未知の場合
    ガンマ分布の分散(演習 2.42)

                                                          
var[  ]   (  E[ ]) Gam(  | a, b)d   2 Gam(  | a, b)d  E[ ]2
                                     2
                 0                                         0
                                                      2                             2
         1 a a 1                 a    1 1                                a

                                         (a) b 0
                b  exp( b )d               b a 1a 1 exp( b )d   
    0    ( a )                    b                                        b
                                                  2                         2
     1 1                                          a   (a  2) 1  a 

    ( a ) b 2       
                     0
                             z a 1 exp(  z )dz    
                                                   b
                                                                      
                                                          ( a ) b  b 
                                                                   2

                                         2
    (a  1)a(a) 1  a   a
                     2
        ( a )   b2  b  b
分散が未知の場合
事後分布:

         p( | x)  p(x |  ) p( )
尤度関数:
          N
                                         N         2
p(x |  )   N ( xn |  ,  )   exp  ( xn   ) 
                            1    N /2

            n 1                        2 n1        
                                                      (2.145)
共役事前分布:
                               1
p( )  Gam(  | a0 , b0 )         b  exp( b0 )
                                     a0 a0 1

                             (a0 )                   (2.146)
分散が未知の場合
事後分布:
                          N          2
p( | x)    exp b0   ( xn   ) 
            a0 1 N / 2

                         2 n 1        (2.149)
尤度関数:
          N
                                         N         2
p(x |  )   N ( xn |  ,  )   exp  ( xn   ) 
                            1    N /2

            n 1                        2 n1        
                                                      (2.145)
共役事前分布:
                               1
p( )  Gam(  | a0 , b0 )         b  exp( b0 )
                                     a0 a0 1

                             (a0 )                   (2.146)
分散が未知の場合
事後分布:
                           N          2
p( | x)    exp b0    ( xn   ) 
            a0 1 N / 2

                          2 n 1        (2.149)
           exp( bN  )
            a N 1

ここで、
             N            1 N                   N 2
  a N  a0      bN  b0   ( xn   ) 2  b0   ML   とする
             2            2 n1                 2
従って事後分布もガンマ分布になる
                                  1
p( | x)  Gam(  | aN , bN )           b  exp( bN  )
                                          a N a N 1

                                ( a N )
分散が未知の場合
事後分布:
                                  1
p( | x)  Gam(  | aN , bN )           b  exp( bN  )
                                          a N a N 1

                                ( a N )
           N                      1 N                 N 2
a N  a0      (2.150)   bN  b0   ( xn   )  b0   ML
                                               2
                                                              (2.151)
           2                      2 n1               2


a0 ,b0 は、分散が b0 / a0 であるような 2a0 個の「有効な」
観測値が事前にあると解釈できる
分散が未知の場合
D次元ガウス分布の場合:

           p(Λ | X)  p(X | Λ) p(Λ)
尤度関数:
           N
                                               1 N                    
p( X | Λ)   N (x n | μ, Λ )  Λ
                         1         N /2
                                           exp  (x n  μ) Λ(x n  μ)
                                                            T

           n 1                                2 n 1                 
共役事前分布:
                                    ( v  D 1) / 2       1          
 p( Λ)  W ( Λ | W, )  B Λ                                      1
                                                      exp  Tr( W Λ) 
          ウィシャート分布                                        2          
                                                                   (2.155)
分散が未知の場合
ウィシャート分布:
                                        ( v  D 1) / 2       1          
p( Λ)  W ( Λ | W, )  B Λ                                           1
                                                          exp  Tr( W Λ) 
                                                              2          
                                                                              (2.155)


                                                                         1
                             D / 2 D ( D 1) / 4 D
                                                          1  i  
                                                     2  
                   v / 2
    B( W, )  W            2 
                                                                    
                                                                              (2.156)
                                                  i 1           
分散が未知の場合
 ウィシャート分布が共役事前分布であることの確認(演習 2.45)
                                                              N
p( Λ | X)  p( X | Λ) p( Λ)  W ( Λ | W, ) N (x n | μ, Λ 1 )
                                                             n 1

                            1             N /2    1 N                      
                        exp  Tr( W 1Λ)   Λ exp  (x n  μ) T Λ(x n  μ)
      ( v  D 1) / 2
Λ
                            2                     2 n 1                   

  (x  μ) T Λ (x  μ)  Tr (x  μ)(x  μ) T Λ                  より
                                                   1  1 N                      T 
                                                                                         
 p ( Λ | X)  Λ          (  D 1 N ) / 2
                                              exp  Tr  W   (x n  μ)(x n  μ)  Λ 
                                                   2 
                                                              n 1                   
分散が未知の場合
 ウィシャート分布が共役事前分布であることの確認(演習 2.45)

                                           1  1 N                      T 
                                                                                 
p ( Λ | X)  Λ   (  D 1 N ) / 2
                                      exp  Tr  W   (x n  μ)(x n  μ)  Λ 
                                           2 
                                                      n 1                   
 従って、事後分布も以下のようなウィシャート分布になる

 p ( Λ | X)  W ( Λ |  N , WN )
                                              N
 N   N               W  W   (x n  μ)(x n  μ) T
                              1
                              N
                                         1

                                              n 1
平均と分散が未知の場合
事後分布:
p(,  | x)  p(x | ,  ) p(,  )
尤度関数:
                            1/ 2
                 N
                                              2
 p(x |  ,  )                 exp ( xn   ) 
                 n 1  2            2           
                            N
   1/ 2           2
                                 N
                                           N 2
  exp 
          2               exp  xn   xn 
                          
                             n 1    2 n 1  (2.152)
平均と分散が未知の場合
尤度関数:
                                    N
                 1/ 2     2
                                         N
                                                   N 2
p(x |  ,  )   exp 
                        2         exp  xn   xn 
                                  
                                     n 1    2 n 1 
                                                          (2.152)

共役事前分布:
                                          
                      1/ 2      2
                                        
        p(  ,  )   exp 
                             2          expc  d 
                                        
                                      
                                /2       c2  
        exp   (   c /  ) 2  exp  d 
                                                        (2.153)
             2                              2  
                                                   
平均と分散が未知の場合
共役事前分布:
                                    
                 1/ 2     2
                                  
   p(  ,  )   exp 
                        2         expc  d 
                                  
                                
                            /2       c2  
    exp   (   c /  ) 2  exp  d 
                                               
                                            2  
                                                      (2.153)
         2                                 
                          0  c / 
                          a  1  / 2
                         b  d  c 2 / 2

   p( ,  )  N  | 0 , ( ) 1 Gam( | a, b)    (2.154)

                      正規-ガンマ分布
平均と分散が未知の場合
正規-ガンマ分布:
  p( ,  )  N  | 0 , ( ) 1 Gam( | a, b)
平均と分散が未知の場合
D次元ガウス分布の場合:

共役事前分布:

p(μ, Λ | μ0 ,  , W, )  N (μ | μ0 , (Λ) )W (Λ | W, )
                                       1


                正規-ウィシャート分布                           (2.157)
まとめ
ガウス分布に対する,平均及び分散の共役事前
分布は以下のようにまとめられる

      平均が未知   分散が未知   平均と分散が
                      未知
1次元   ガウス分布   ガンマ分布   ガウス-ガンマ
                      分布
D次元   ガウス分布   ウィシャート分 ガウス-ウィ
              布       シャート分布
ご静聴ありがとうございました。

Mais conteúdo relacionado

Mais procurados

Sliced Wasserstein距離と生成モデル
Sliced Wasserstein距離と生成モデルSliced Wasserstein距離と生成モデル
Sliced Wasserstein距離と生成モデルohken
 
C:\D Drive\Prml\プレゼン\パターン認識と機械学習2 4章 D0703
C:\D Drive\Prml\プレゼン\パターン認識と機械学習2 4章 D0703C:\D Drive\Prml\プレゼン\パターン認識と機械学習2 4章 D0703
C:\D Drive\Prml\プレゼン\パターン認識と機械学習2 4章 D0703Yoshinori Kabeya
 
グラフィカルモデル入門
グラフィカルモデル入門グラフィカルモデル入門
グラフィカルモデル入門Kawamoto_Kazuhiko
 
クラシックな機械学習入門:付録:よく使う線形代数の公式
クラシックな機械学習入門:付録:よく使う線形代数の公式クラシックな機械学習入門:付録:よく使う線形代数の公式
クラシックな機械学習入門:付録:よく使う線形代数の公式Hiroshi Nakagawa
 
PRML輪読#8
PRML輪読#8PRML輪読#8
PRML輪読#8matsuolab
 
PRML輪読#3
PRML輪読#3PRML輪読#3
PRML輪読#3matsuolab
 
PRML輪読#4
PRML輪読#4PRML輪読#4
PRML輪読#4matsuolab
 
自動微分変分ベイズ法の紹介
自動微分変分ベイズ法の紹介自動微分変分ベイズ法の紹介
自動微分変分ベイズ法の紹介Taku Yoshioka
 
PRML上巻勉強会 at 東京大学 資料 第2章2.3.3 〜 2.5.2
PRML上巻勉強会 at 東京大学 資料 第2章2.3.3 〜 2.5.2PRML上巻勉強会 at 東京大学 資料 第2章2.3.3 〜 2.5.2
PRML上巻勉強会 at 東京大学 資料 第2章2.3.3 〜 2.5.2Hiroyuki Kato
 
変分ベイズ法の説明
変分ベイズ法の説明変分ベイズ法の説明
変分ベイズ法の説明Haruka Ozaki
 
相関と因果について考える:統計的因果推論、その(不)可能性の中心
相関と因果について考える:統計的因果推論、その(不)可能性の中心相関と因果について考える:統計的因果推論、その(不)可能性の中心
相関と因果について考える:統計的因果推論、その(不)可能性の中心takehikoihayashi
 
PRML上巻勉強会 at 東京大学 資料 第1章後半
PRML上巻勉強会 at 東京大学 資料 第1章後半PRML上巻勉強会 at 東京大学 資料 第1章後半
PRML上巻勉強会 at 東京大学 資料 第1章後半Ohsawa Goodfellow
 
PRML 1.5-1.5.5 決定理論
PRML 1.5-1.5.5 決定理論PRML 1.5-1.5.5 決定理論
PRML 1.5-1.5.5 決定理論Akihiro Nitta
 
PRML読書会#2,#3資料
PRML読書会#2,#3資料PRML読書会#2,#3資料
PRML読書会#2,#3資料Hiromasa Ohashi
 
ファクター投資と機械学習
ファクター投資と機械学習ファクター投資と機械学習
ファクター投資と機械学習Kei Nakagawa
 
pymcとpystanでベイズ推定してみた話
pymcとpystanでベイズ推定してみた話pymcとpystanでベイズ推定してみた話
pymcとpystanでベイズ推定してみた話Classi.corp
 

Mais procurados (20)

Sliced Wasserstein距離と生成モデル
Sliced Wasserstein距離と生成モデルSliced Wasserstein距離と生成モデル
Sliced Wasserstein距離と生成モデル
 
PRML_titech 2.3.1 - 2.3.7
PRML_titech 2.3.1 - 2.3.7PRML_titech 2.3.1 - 2.3.7
PRML_titech 2.3.1 - 2.3.7
 
C:\D Drive\Prml\プレゼン\パターン認識と機械学習2 4章 D0703
C:\D Drive\Prml\プレゼン\パターン認識と機械学習2 4章 D0703C:\D Drive\Prml\プレゼン\パターン認識と機械学習2 4章 D0703
C:\D Drive\Prml\プレゼン\パターン認識と機械学習2 4章 D0703
 
グラフィカルモデル入門
グラフィカルモデル入門グラフィカルモデル入門
グラフィカルモデル入門
 
クラシックな機械学習入門:付録:よく使う線形代数の公式
クラシックな機械学習入門:付録:よく使う線形代数の公式クラシックな機械学習入門:付録:よく使う線形代数の公式
クラシックな機械学習入門:付録:よく使う線形代数の公式
 
PRML輪読#8
PRML輪読#8PRML輪読#8
PRML輪読#8
 
PRML輪読#3
PRML輪読#3PRML輪読#3
PRML輪読#3
 
PRML 2.4
PRML 2.4PRML 2.4
PRML 2.4
 
PRML輪読#4
PRML輪読#4PRML輪読#4
PRML輪読#4
 
自動微分変分ベイズ法の紹介
自動微分変分ベイズ法の紹介自動微分変分ベイズ法の紹介
自動微分変分ベイズ法の紹介
 
PRML上巻勉強会 at 東京大学 資料 第2章2.3.3 〜 2.5.2
PRML上巻勉強会 at 東京大学 資料 第2章2.3.3 〜 2.5.2PRML上巻勉強会 at 東京大学 資料 第2章2.3.3 〜 2.5.2
PRML上巻勉強会 at 東京大学 資料 第2章2.3.3 〜 2.5.2
 
変分ベイズ法の説明
変分ベイズ法の説明変分ベイズ法の説明
変分ベイズ法の説明
 
相関と因果について考える:統計的因果推論、その(不)可能性の中心
相関と因果について考える:統計的因果推論、その(不)可能性の中心相関と因果について考える:統計的因果推論、その(不)可能性の中心
相関と因果について考える:統計的因果推論、その(不)可能性の中心
 
PRML上巻勉強会 at 東京大学 資料 第1章後半
PRML上巻勉強会 at 東京大学 資料 第1章後半PRML上巻勉強会 at 東京大学 資料 第1章後半
PRML上巻勉強会 at 東京大学 資料 第1章後半
 
Stan超初心者入門
Stan超初心者入門Stan超初心者入門
Stan超初心者入門
 
PRML 1.5-1.5.5 決定理論
PRML 1.5-1.5.5 決定理論PRML 1.5-1.5.5 決定理論
PRML 1.5-1.5.5 決定理論
 
PRML読書会#2,#3資料
PRML読書会#2,#3資料PRML読書会#2,#3資料
PRML読書会#2,#3資料
 
ファクター投資と機械学習
ファクター投資と機械学習ファクター投資と機械学習
ファクター投資と機械学習
 
ELBO型VAEのダメなところ
ELBO型VAEのダメなところELBO型VAEのダメなところ
ELBO型VAEのダメなところ
 
pymcとpystanでベイズ推定してみた話
pymcとpystanでベイズ推定してみた話pymcとpystanでベイズ推定してみた話
pymcとpystanでベイズ推定してみた話
 

Semelhante a Chapter2.3.6

8.4 グラフィカルモデルによる推論
8.4 グラフィカルモデルによる推論8.4 グラフィカルモデルによる推論
8.4 グラフィカルモデルによる推論sleepy_yoshi
 
Jokyonokai
JokyonokaiJokyonokai
Jokyonokainwpmq516
 
Jokyonokai
JokyonokaiJokyonokai
Jokyonokainwpmq516
 
お披露目会05/2010
お披露目会05/2010お披露目会05/2010
お披露目会05/2010JAVA DM
 
086 独立性の検定
086 独立性の検定086 独立性の検定
086 独立性の検定t2tarumi
 
080 統計的推測 検定
080 統計的推測 検定080 統計的推測 検定
080 統計的推測 検定t2tarumi
 
確率的主成分分析
確率的主成分分析確率的主成分分析
確率的主成分分析Mika Yoshimura
 
パターン認識 05 ロジスティック回帰
パターン認識 05 ロジスティック回帰パターン認識 05 ロジスティック回帰
パターン認識 05 ロジスティック回帰sleipnir002
 
PRML ベイズロジスティック回帰
PRML ベイズロジスティック回帰PRML ベイズロジスティック回帰
PRML ベイズロジスティック回帰hagino 3000
 
13.2 隠れマルコフモデル
13.2 隠れマルコフモデル13.2 隠れマルコフモデル
13.2 隠れマルコフモデルshow you
 
PRML復々習レーン2.3.2
PRML復々習レーン2.3.2PRML復々習レーン2.3.2
PRML復々習レーン2.3.2sukoyakarizumu
 
コンピュータービジョン最先端ガイド2 3.4ベクトルデータに対するカーネル法(SVM)
コンピュータービジョン最先端ガイド2 3.4ベクトルデータに対するカーネル法(SVM) コンピュータービジョン最先端ガイド2 3.4ベクトルデータに対するカーネル法(SVM)
コンピュータービジョン最先端ガイド2 3.4ベクトルデータに対するカーネル法(SVM) Takahiro (Poly) Horikawa
 
Rで学ぶデータサイエンス第13章(ミニマックス確率マシン)
Rで学ぶデータサイエンス第13章(ミニマックス確率マシン)Rで学ぶデータサイエンス第13章(ミニマックス確率マシン)
Rで学ぶデータサイエンス第13章(ミニマックス確率マシン)Daisuke Yoneoka
 

Semelhante a Chapter2.3.6 (20)

PRML Chapter5.2
PRML Chapter5.2PRML Chapter5.2
PRML Chapter5.2
 
Re revenge chap03-1
Re revenge chap03-1Re revenge chap03-1
Re revenge chap03-1
 
PRML chapter5
PRML chapter5PRML chapter5
PRML chapter5
 
8.4 グラフィカルモデルによる推論
8.4 グラフィカルモデルによる推論8.4 グラフィカルモデルによる推論
8.4 グラフィカルモデルによる推論
 
Jokyonokai
JokyonokaiJokyonokai
Jokyonokai
 
Jokyonokai
JokyonokaiJokyonokai
Jokyonokai
 
お披露目会05/2010
お披露目会05/2010お披露目会05/2010
お披露目会05/2010
 
086 独立性の検定
086 独立性の検定086 独立性の検定
086 独立性の検定
 
080 統計的推測 検定
080 統計的推測 検定080 統計的推測 検定
080 統計的推測 検定
 
確率的主成分分析
確率的主成分分析確率的主成分分析
確率的主成分分析
 
パターン認識 05 ロジスティック回帰
パターン認識 05 ロジスティック回帰パターン認識 05 ロジスティック回帰
パターン認識 05 ロジスティック回帰
 
PRML 8.4-8.4.3
PRML 8.4-8.4.3 PRML 8.4-8.4.3
PRML 8.4-8.4.3
 
PRML chapter7
PRML chapter7PRML chapter7
PRML chapter7
 
PRML ベイズロジスティック回帰
PRML ベイズロジスティック回帰PRML ベイズロジスティック回帰
PRML ベイズロジスティック回帰
 
13.2 隠れマルコフモデル
13.2 隠れマルコフモデル13.2 隠れマルコフモデル
13.2 隠れマルコフモデル
 
PRML 2.3節
PRML 2.3節PRML 2.3節
PRML 2.3節
 
PRML復々習レーン2.3.2
PRML復々習レーン2.3.2PRML復々習レーン2.3.2
PRML復々習レーン2.3.2
 
Chapter9 2
Chapter9 2Chapter9 2
Chapter9 2
 
コンピュータービジョン最先端ガイド2 3.4ベクトルデータに対するカーネル法(SVM)
コンピュータービジョン最先端ガイド2 3.4ベクトルデータに対するカーネル法(SVM) コンピュータービジョン最先端ガイド2 3.4ベクトルデータに対するカーネル法(SVM)
コンピュータービジョン最先端ガイド2 3.4ベクトルデータに対するカーネル法(SVM)
 
Rで学ぶデータサイエンス第13章(ミニマックス確率マシン)
Rで学ぶデータサイエンス第13章(ミニマックス確率マシン)Rで学ぶデータサイエンス第13章(ミニマックス確率マシン)
Rで学ぶデータサイエンス第13章(ミニマックス確率マシン)
 

Mais de Takuya Minagawa

Machine Learning Operations (MLOps): Overview, Definition, and Architecture
Machine Learning Operations (MLOps): Overview, Definition, and ArchitectureMachine Learning Operations (MLOps): Overview, Definition, and Architecture
Machine Learning Operations (MLOps): Overview, Definition, and ArchitectureTakuya Minagawa
 
点群SegmentationのためのTransformerサーベイ
点群SegmentationのためのTransformerサーベイ点群SegmentationのためのTransformerサーベイ
点群SegmentationのためのTransformerサーベイTakuya Minagawa
 
Learning to Solve Hard Minimal Problems
Learning to Solve Hard Minimal ProblemsLearning to Solve Hard Minimal Problems
Learning to Solve Hard Minimal ProblemsTakuya Minagawa
 
ConditionalPointDiffusion.pdf
ConditionalPointDiffusion.pdfConditionalPointDiffusion.pdf
ConditionalPointDiffusion.pdfTakuya Minagawa
 
楽しいコンピュータビジョンの受託仕事
楽しいコンピュータビジョンの受託仕事楽しいコンピュータビジョンの受託仕事
楽しいコンピュータビジョンの受託仕事Takuya Minagawa
 
20200910コンピュータビジョン今昔物語(JPTA講演資料)
20200910コンピュータビジョン今昔物語(JPTA講演資料)20200910コンピュータビジョン今昔物語(JPTA講演資料)
20200910コンピュータビジョン今昔物語(JPTA講演資料)Takuya Minagawa
 
2020/07/04 BSP-Net (CVPR2020)
2020/07/04 BSP-Net (CVPR2020)2020/07/04 BSP-Net (CVPR2020)
2020/07/04 BSP-Net (CVPR2020)Takuya Minagawa
 
20190706cvpr2019_3d_shape_representation
20190706cvpr2019_3d_shape_representation20190706cvpr2019_3d_shape_representation
20190706cvpr2019_3d_shape_representationTakuya Minagawa
 
20190307 visualslam summary
20190307 visualslam summary20190307 visualslam summary
20190307 visualslam summaryTakuya Minagawa
 
20190131 lidar-camera fusion semantic segmentation survey
20190131 lidar-camera fusion semantic segmentation survey20190131 lidar-camera fusion semantic segmentation survey
20190131 lidar-camera fusion semantic segmentation surveyTakuya Minagawa
 
2018/12/28 LiDARで取得した道路上点群に対するsemantic segmentation
2018/12/28 LiDARで取得した道路上点群に対するsemantic segmentation2018/12/28 LiDARで取得した道路上点群に対するsemantic segmentation
2018/12/28 LiDARで取得した道路上点群に対するsemantic segmentationTakuya Minagawa
 
run Keras model on opencv
run Keras model on opencvrun Keras model on opencv
run Keras model on opencvTakuya Minagawa
 
20181130 lidar object detection survey
20181130 lidar object detection survey20181130 lidar object detection survey
20181130 lidar object detection surveyTakuya Minagawa
 
object detection with lidar-camera fusion: survey (updated)
object detection with lidar-camera fusion: survey (updated)object detection with lidar-camera fusion: survey (updated)
object detection with lidar-camera fusion: survey (updated)Takuya Minagawa
 

Mais de Takuya Minagawa (20)

Machine Learning Operations (MLOps): Overview, Definition, and Architecture
Machine Learning Operations (MLOps): Overview, Definition, and ArchitectureMachine Learning Operations (MLOps): Overview, Definition, and Architecture
Machine Learning Operations (MLOps): Overview, Definition, and Architecture
 
MobileNeRF
MobileNeRFMobileNeRF
MobileNeRF
 
点群SegmentationのためのTransformerサーベイ
点群SegmentationのためのTransformerサーベイ点群SegmentationのためのTransformerサーベイ
点群SegmentationのためのTransformerサーベイ
 
Learning to Solve Hard Minimal Problems
Learning to Solve Hard Minimal ProblemsLearning to Solve Hard Minimal Problems
Learning to Solve Hard Minimal Problems
 
ConditionalPointDiffusion.pdf
ConditionalPointDiffusion.pdfConditionalPointDiffusion.pdf
ConditionalPointDiffusion.pdf
 
楽しいコンピュータビジョンの受託仕事
楽しいコンピュータビジョンの受託仕事楽しいコンピュータビジョンの受託仕事
楽しいコンピュータビジョンの受託仕事
 
20210711 deepI2P
20210711 deepI2P20210711 deepI2P
20210711 deepI2P
 
20201010 personreid
20201010 personreid20201010 personreid
20201010 personreid
 
20200910コンピュータビジョン今昔物語(JPTA講演資料)
20200910コンピュータビジョン今昔物語(JPTA講演資料)20200910コンピュータビジョン今昔物語(JPTA講演資料)
20200910コンピュータビジョン今昔物語(JPTA講演資料)
 
2020/07/04 BSP-Net (CVPR2020)
2020/07/04 BSP-Net (CVPR2020)2020/07/04 BSP-Net (CVPR2020)
2020/07/04 BSP-Net (CVPR2020)
 
20200704 bsp net
20200704 bsp net20200704 bsp net
20200704 bsp net
 
20190825 vins mono
20190825 vins mono20190825 vins mono
20190825 vins mono
 
20190706cvpr2019_3d_shape_representation
20190706cvpr2019_3d_shape_representation20190706cvpr2019_3d_shape_representation
20190706cvpr2019_3d_shape_representation
 
20190307 visualslam summary
20190307 visualslam summary20190307 visualslam summary
20190307 visualslam summary
 
Visual slam
Visual slamVisual slam
Visual slam
 
20190131 lidar-camera fusion semantic segmentation survey
20190131 lidar-camera fusion semantic segmentation survey20190131 lidar-camera fusion semantic segmentation survey
20190131 lidar-camera fusion semantic segmentation survey
 
2018/12/28 LiDARで取得した道路上点群に対するsemantic segmentation
2018/12/28 LiDARで取得した道路上点群に対するsemantic segmentation2018/12/28 LiDARで取得した道路上点群に対するsemantic segmentation
2018/12/28 LiDARで取得した道路上点群に対するsemantic segmentation
 
run Keras model on opencv
run Keras model on opencvrun Keras model on opencv
run Keras model on opencv
 
20181130 lidar object detection survey
20181130 lidar object detection survey20181130 lidar object detection survey
20181130 lidar object detection survey
 
object detection with lidar-camera fusion: survey (updated)
object detection with lidar-camera fusion: survey (updated)object detection with lidar-camera fusion: survey (updated)
object detection with lidar-camera fusion: survey (updated)
 

Chapter2.3.6

  • 2. おさらい • ガウス分布(1次元)  p( x |  ,  )  N x |  ,  2  1  1   exp ( x   )2  (2 2 )1/ 2  2 2  正規化係数 二次形式  μ x
  • 3. おさらい • ガウス分布(D次元) p(x | μ, Σ)  N x | μ, Σ  1 1  1 T 1   exp (x  μ) Σ (x  μ) (2 ) D/2 Σ 1/ 2  2  正規化係数 二次形式 Σ μ x
  • 4. おさらい • 最尤推定 N p(x | θ)   p( xn | θ) 尤度 n 1 観測データ パラメータ サンプル データが観測されたとき,そのデータが発生する確 率(尤度)を最大化するパラメータを求めること
  • 5. おさらい • ベイズ推論 p(x | θ) p(θ) p(θ | x)  p ( x) 事後分布 N  p(x | θ) p(θ)  p(θ) p( xn | θ) n 1 尤度 事前分布 データが観測されたとき,パラメータがとる確率分布 を求める
  • 7. 平均が未知の場合 平均の事後分布: p( | x)  p(x |  ) p( ) 尤度関数: N N p ( x |  )   p ( xn |  )   N ( x n |  ,  2 ) μについてもガウス 分布になっている n 1 n 1 1  1 N   (2 ) 2 N /2 exp 2  2  ( xn   )  n 1  2 (2.137) 何か事前分布を仮定してやる必要がある
  • 8. 平均が未知の場合 試しに平均の事前分布もガウス分布で表わしてみる 事前分布: p( )  N  | 0 ,  2 0  事後分布:   N x N p (  | x)  p ( x |  ) p (  )  N  |  0 ,  0 2 n | ,  n 1 (2.138)+(2.139)
  • 9. 平均が未知の場合 演習 2.38   N x N p(x |  ) p(  )  N  | 0 ,  2 0 n |  ,  n 1 1  1 2 1  1 N 2  exp 2 (   0 )   exp 2  ( xn   )  (2 0 )2 1/ 2  2 0  (2 ) 2 N /2  2 n 1  1  1 1 N 2  exp 2 (   0 )  2  ( xn   )  2 (2 ) ( N 1) / 2  0 N  2 0 2 n 1  ここだけ取り出して計算
  • 10. 平均が未知の場合 演習 2.38 (続き) N 1 1  2 0 2 (  0 )  2 2 2  ( xn   ) 2 n 1  N 1  2  1 N 1    2   2    2 2  2 0    xn   2 0   const    n 1 0   N 1  2  2 0 2 N 2 2     2   2    2 2  2 0   N  2  xn   2 N   2 0    const    0 n 1 0     xn    0  2 1  2 2  N   2   2    2  0   const 2 0  0 N  2 2     1    2  2    N 2  const  平方完成!  N 
  • 11. 平均が未知の場合 演習 2.38 (続き) 事後分布は  p( | x)  N  |  N ,  2 N  (2.140) ただし, 2 N 02 1 1 N N  0   ML   N 0   2 2 N 0   2 2 (2.141)  2 N  2 0 2 (2.142) N 1  ML  N x n 1 n (2.143)
  • 12. 平均が未知の場合 まとめると p( | x)  p(x |  ) p( ) N  |  N ,  2 N  N N  | 0 ,  2 0   N ( xn |  ,  2 ) n 1 尤度関数、事前分布、事後分布がみんな平均μにつ いてのガウス分布になった!
  • 14. 結論 ガウス分布に対する,平均及び分散の共役事前 分布は以下のようにまとめられる 平均が未知 分散が未知 平均と分散が 未知 1次元 ガウス分布 ガンマ分布 ガウス-ガンマ 分布 D次元 ガウス分布 ウィシャート分 ガウス-ウィ 布 シャート分布
  • 15. 平均が未知の場合 平均の事後分布:  p( | x)  N  |  N ,  2 N  2 N 02 1 1 N N  0   ML   N 0   2 2 N 0   2 2  2 N  2 0 2 N=0の時、  N  0  N  0 観測データがない場合,事後分布=事前分布
  • 16. 平均が未知の場合 平均の事後分布:  p( | x)  N  |  N ,  2 N  2 N 02 1 1 N N  0   ML   N 0   2 2 N 0   2 2  2 N  2 0 2 N→∞の時、  N   ML N  0 観測データ多いと事後分布は最尤推定解に近づく
  • 18. 平均が未知の場合 D次元ガウス分布の場合(演習2.40): N N p ( X | μ) p (μ)  p (μ) p(x n | μ)  N μ | μ 0 , Σ 0  N x n | μ, Σ  n 1 n 1 1 1  1 1 N   exp (μ  μ 0 ) Σ 0 (μ  μ 0 )   (x n  μ) T Σ 1 (x n  μ) T 1 (2 ) ( N 1) D / 2 Σ ( N 1) / 2  2 2 n 1 
  • 19. 平均が未知の場合 D次元ガウス分布の場合(演習2.40): 1 1 N  (μ  μ 0 ) Σ 0 (μ  μ 0 )   (x n  μ) T Σ 1 (x n  μ) T 1 2 2 n 1 1 T 1 2  1 1 T 1 2 1 T 1 1 N T 1    μ Σ 0  NΣ μ  μ Σ 0 μ 0  μ 0 Σ 0 μ   μ Σ x n  μΣ1x T  const 2 2 n 1 n  T  1    N 1 T 1   μ Σ 0  NΣ μ  μ  Σ 0 μ 0  Σ  x n   const 1 1 2  n 1  1  μ  μ N T Σ 1 μ  μ N   const N 2 ただし  1 μ N  Σ  NΣ 0  Σ 1 1 1 0 1 μ 0  Σ μ ML  μ ML  1 N x n N  Σ  n 1 1 ΣN 0  NΣ1
  • 20. 平均が未知の場合 逐次更新式: N p(  | x)  p(  ) p( xn |  ) n 1  N 1    p(  ) p( xn |  ) p( xN |  )  n 1  (2.144) 新たな事前分布とみなす
  • 21. 分散が未知の場合 1 分散の代わりに精度を用いる   2 p( | x)  p(x |  ) p( ) 尤度関数: N   N 2 p(x |  )   N ( xn |  ,  )   exp  ( xn   )  1 N /2 n 1  2 n1  (2.145) 共役事前分布: λについて同じ関数形! 1 a a 1 p( )  Gam( | a, b)  b  exp( b ) (a) (2.146) ガンマ分布
  • 22. 分散が未知の場合 演習2.41 1 a a 1 Gam(  | a, b)  b  exp( b ) ( a ) が、正規化されていることを証明  1 a a 1 b  0 (a) b  exp(b )d  (a) 0 (b ) a 1 exp( b )d 1 z  b とおくと、 d  dz なので、 b b  1  a 1 0 (b ) exp(b )d  (a) 0 z exp( z)dz a 1 (a)
  • 23. 分散が未知の場合 演習2.41 (続き)  (a)   u a 1 exp( u)du 0 なので、 1  a 1 (a) 0 z exp( z)dz  1 よって正規化されている。
  • 24. 分散が未知の場合 ガンマ分布: 1 a a 1 Gam(  | a, b)  b  exp( b ) ( a )
  • 25. 分散が未知の場合 ガンマ分布の期待値(演習 2.42)    E[ ]    Gam(  | a, b)d   b a a 1 exp( b )d 0 0 ( a ) 1 z  b とおくと、 d  dz なので、 b  1 1  a    Gam(  | a, b)d  0 z exp( z)dz 0 ( a ) b (a  1) a(a) a    b(a) b(a) b 演習1.17参照
  • 26. 分散が未知の場合 ガンマ分布の分散(演習 2.42)   var[  ]   (  E[ ]) Gam(  | a, b)d   2 Gam(  | a, b)d  E[ ]2 2 0 0 2 2  1 a a 1 a 1 1  a  (a) b 0 b  exp( b )d     b a 1a 1 exp( b )d    0 ( a ) b b 2 2 1 1  a (a  2) 1  a   ( a ) b 2  0 z a 1 exp(  z )dz     b   ( a ) b  b  2 2 (a  1)a(a) 1  a  a     2 ( a ) b2  b  b
  • 27. 分散が未知の場合 事後分布: p( | x)  p(x |  ) p( ) 尤度関数: N   N 2 p(x |  )   N ( xn |  ,  )   exp  ( xn   )  1 N /2 n 1  2 n1  (2.145) 共役事前分布: 1 p( )  Gam(  | a0 , b0 )  b  exp( b0 ) a0 a0 1 (a0 ) (2.146)
  • 28. 分散が未知の場合 事後分布:   N 2 p( | x)    exp b0   ( xn   )  a0 1 N / 2  2 n 1 (2.149) 尤度関数: N   N 2 p(x |  )   N ( xn |  ,  )   exp  ( xn   )  1 N /2 n 1  2 n1  (2.145) 共役事前分布: 1 p( )  Gam(  | a0 , b0 )  b  exp( b0 ) a0 a0 1 (a0 ) (2.146)
  • 29. 分散が未知の場合 事後分布:   N 2 p( | x)    exp b0    ( xn   )  a0 1 N / 2  2 n 1 (2.149)   exp( bN  ) a N 1 ここで、 N 1 N N 2 a N  a0  bN  b0   ( xn   ) 2  b0   ML とする 2 2 n1 2 従って事後分布もガンマ分布になる 1 p( | x)  Gam(  | aN , bN )  b  exp( bN  ) a N a N 1 ( a N )
  • 30. 分散が未知の場合 事後分布: 1 p( | x)  Gam(  | aN , bN )  b  exp( bN  ) a N a N 1 ( a N ) N 1 N N 2 a N  a0  (2.150) bN  b0   ( xn   )  b0   ML 2 (2.151) 2 2 n1 2 a0 ,b0 は、分散が b0 / a0 であるような 2a0 個の「有効な」 観測値が事前にあると解釈できる
  • 31. 分散が未知の場合 D次元ガウス分布の場合: p(Λ | X)  p(X | Λ) p(Λ) 尤度関数: N  1 N  p( X | Λ)   N (x n | μ, Λ )  Λ 1 N /2 exp  (x n  μ) Λ(x n  μ) T n 1  2 n 1  共役事前分布: ( v  D 1) / 2  1  p( Λ)  W ( Λ | W, )  B Λ 1 exp  Tr( W Λ)  ウィシャート分布  2  (2.155)
  • 32. 分散が未知の場合 ウィシャート分布: ( v  D 1) / 2  1  p( Λ)  W ( Λ | W, )  B Λ 1 exp  Tr( W Λ)   2  (2.155) 1  D / 2 D ( D 1) / 4 D   1  i     2   v / 2 B( W, )  W 2    (2.156)  i 1  
  • 33. 分散が未知の場合 ウィシャート分布が共役事前分布であることの確認(演習 2.45) N p( Λ | X)  p( X | Λ) p( Λ)  W ( Λ | W, ) N (x n | μ, Λ 1 ) n 1  1  N /2  1 N  exp  Tr( W 1Λ)   Λ exp  (x n  μ) T Λ(x n  μ) ( v  D 1) / 2 Λ  2   2 n 1  (x  μ) T Λ (x  μ)  Tr (x  μ)(x  μ) T Λ   より  1  1 N T   p ( Λ | X)  Λ (  D 1 N ) / 2 exp  Tr  W   (x n  μ)(x n  μ)  Λ   2   n 1   
  • 34. 分散が未知の場合 ウィシャート分布が共役事前分布であることの確認(演習 2.45)  1  1 N T   p ( Λ | X)  Λ (  D 1 N ) / 2 exp  Tr  W   (x n  μ)(x n  μ)  Λ   2   n 1    従って、事後分布も以下のようなウィシャート分布になる p ( Λ | X)  W ( Λ |  N , WN ) N  N   N W  W   (x n  μ)(x n  μ) T 1 N 1 n 1
  • 35. 平均と分散が未知の場合 事後分布: p(,  | x)  p(x | ,  ) p(,  ) 尤度関数: 1/ 2 N      2 p(x |  ,  )     exp ( xn   )  n 1  2   2  N  1/ 2   2   N  N 2   exp   2  exp  xn   xn       n 1 2 n 1  (2.152)
  • 36. 平均と分散が未知の場合 尤度関数: N  1/ 2   2   N  N 2 p(x |  ,  )   exp   2  exp  xn   xn       n 1 2 n 1  (2.152) 共役事前分布:   1/ 2   2  p(  ,  )   exp   2  expc  d          /2   c2    exp (   c /  ) 2  exp  d     (2.153)  2    2   
  • 37. 平均と分散が未知の場合 共役事前分布:   1/ 2   2  p(  ,  )   exp   2  expc  d          /2   c2    exp (   c /  ) 2  exp  d     2   (2.153)  2     0  c /  a  1  / 2 b  d  c 2 / 2 p( ,  )  N  | 0 , ( ) 1 Gam( | a, b) (2.154) 正規-ガンマ分布
  • 38. 平均と分散が未知の場合 正規-ガンマ分布: p( ,  )  N  | 0 , ( ) 1 Gam( | a, b)
  • 39. 平均と分散が未知の場合 D次元ガウス分布の場合: 共役事前分布: p(μ, Λ | μ0 ,  , W, )  N (μ | μ0 , (Λ) )W (Λ | W, ) 1 正規-ウィシャート分布 (2.157)
  • 40. まとめ ガウス分布に対する,平均及び分散の共役事前 分布は以下のようにまとめられる 平均が未知 分散が未知 平均と分散が 未知 1次元 ガウス分布 ガンマ分布 ガウス-ガンマ 分布 D次元 ガウス分布 ウィシャート分 ガウス-ウィ 布 シャート分布