SlideShare uma empresa Scribd logo
1 de 3
Baixar para ler offline
A derivation of Eqs. (4) and (5) of
Sparse stochastic inference for latent Dirichlet allocation
Tomonari MASADA @ Nagasaki University
May 23, 2013
The evidence can be written as follows:
p(w|α, η) =
z k
p(βk|η)
d
p(θd|α)p(zd|θd)p(w|zd, β) dθdβ . (1)
By integrating θ out, we have
p(w|α, η) =
z k
p(βk|η)
d
p(zd|α)p(w|zd, β) dβ . (2)
By applying Jensen’s inequality, we have a lower bound of the evidence as follows:
log p(w|α, η) = log
z k
p(βk|η)
d
p(zd|α)p(w|zd, β)dβ
= log
z d
q(zd)
k
q(βk) k p(βk|η) d p(zd|α)p(w|zd, β)
d q(zd) k q(βk)
dβ
≥
z d
q(zd)
k
q(βk) log k p(βk|η) d p(zd|α)p(w|zd, β)
d q(zd) k q(βk)
dβ
=
k
q(βk) log p(βk|η)dβk +
d zd
q(zd) log p(zd|α)
+
k
q(βk)
d zd
q(zd) log p(w|zd, β)dβ + H(q)
=
k
q(βk) log p(βk|η)dβk +
d zd
q(zd) log p(zd|α)
+
k
q(βk)
d zd
q(zd)
Nd
i=1
log βzdiwdi
dβ + H(q) , (3)
where H(q) = k q(βk) log q(βk)dβk + d zd
q(zd) log q(zd). Let L denote the lower bound in Eq. (3).
By picking up the terms related to zd from L, we define Lzd
as follows:
Lzd
=
zd
q(zd) log p(zd|α) +
k
q(βk)
zd
q(zd)
Nd
i=1
log βzdiwdi
dβ −
zd
q(zd) log q(zd) . (4)
We obtain a functional derivative of Lzd
with respect to q(zd) as follows:
δLzd
δq(zd)
= lim
→0
zd
{q(zd) + δ(zd − zd)} log p(zd|α) − zd
q(zd) log p(zd|α)
+ lim
→0
k q(βk) zd
{q(zd) + δ(zd − zd)}
Nd
i=1 log βzdiwdi
− zd
q(zd)
Nd
i=1 log βzdiwdi
dβ
− lim
→0
zd
{q(zd) + δ(zd − zd)} log{q(zd) + δ(zd − zd)} − zd
q(zd) log q(zd)
, (5)
1
where
lim
→0
zd
{q(zd) + δ(zd − zd)} log{q(zd) + δ(zd − zd)} − zd
q(zd) log q(zd)
= lim
→0
zd
q(zd) log
q(zd)+ δ(zd−zd)
q(zd) + zd
δ(zd − zd) log{q(zd) + δ(zd − zd)}
= lim
→0
zd
q(zd)
δ(zd−zd)
q(zd) + O( 2
)
+ lim
→0
zd
δ(zd − zd) log{q(zd) + δ(zd − zd)}
=
zd
δ(zd − zd) +
zd
δ(zd − zd) log q(zd) = 1 + log q(zd) . (6)
Therefore,
δLzd
δq(zd)
= log p(zd|α) +
k
q(βk)
Nd
i=1
log βzdiwdi
dβ − 1 − log q(zd) (7)
By solving
δLzd
δq(zd) = 0, we obtain
q(zd) ∝ p(zd|α) · exp
k
q(βk)
Nd
i=1
log βzdiwdi
dβ
= p(zd|α) ·
Nd
i=1
exp
k
q(βk) log βzdiwdi
dβ
∝
Γ(Kα)
Γ(Kα + Nd)
k
Γ(α + i Izdi=k)
Γ(α)
×
i
exp Eq log βzdiwdi
(8)
We assume that q(βk) =
Γ( w λkw)
w Γ(λkw) w βλkw−1
kw . By picking up the terms related to λ from L, we
define Lλ as follows:
Lλ =
k
q(βk) log p(βk|η)dβk +
k
q(βk)
d zd
q(zd)
Nd
i=1
log βzdiwdi
dβ
−
k
q(βk) log q(βk)dβk . (9)
Each term in Eq. (9) can be rewritten as below.
q(βk) log p(βk|η)dβk = log Γ(Wη) −
w
log Γ(η) +
w
(η − 1) Ψ(λkw) − Ψ(
w
λkw) (10)
q(βk) log q(βk)dβk = log Γ(
w
λkw) −
w
log Γ(λkw) +
w
(λkw − 1) Ψ(λkw) − Ψ(
w
λkw) (11)
k
q(βk)
d zd
q(zd)
Nd
i=1
log βzdiwdi
dβ
=
k
q(βk)
d zd
q(zd)
Nd
i=1 k w
I(zdi
= k, wdi
= w) · log βkw dβ
=
k
q(βk)
k w
log βkw
d zd
q(zd)
Nd
i=1
I(zdi = k, wdi = w) dβ
=
k w
Ψ(λkw) − Ψ(
w
λkw)
d zd
q(zd)
Nd
i=1
I(zdi = k, wdi = w) (12)
2
Therefore,
∂Lλ
∂λkw
= η − λkw +
d zd
q(zd)
Nd
i=1
I(zdi = k, wdi = w) Ψ (λkw)
− η − λkw +
d zd
q(zd)
Nd
i=1
I(zdi
= k, wdi
= w) Ψ (
w
λkw) . (13)
By solving ∂Lλ
∂λkw
= 0, we obtain
λkw = η +
d zd
q(zd)
Nd
i=1
I(zdi
= k, wdi
= w) . (14)
3

Mais conteúdo relacionado

Mais procurados

Ejercicios de cálculo diferencial
Ejercicios de cálculo diferencialEjercicios de cálculo diferencial
Ejercicios de cálculo diferencialDavid Pèrez
 
Wilder ejercicios unidad 5
Wilder ejercicios unidad 5Wilder ejercicios unidad 5
Wilder ejercicios unidad 5wilder
 
Limites RESUELTOS
Limites RESUELTOSLimites RESUELTOS
Limites RESUELTOSEducación
 
Ejercicios inecuaciones
Ejercicios inecuacionesEjercicios inecuaciones
Ejercicios inecuacionesIES, ALBORÁN
 
Práctica de ecuaciones de primer grado con una incógnita_prof.grettel...
Práctica  de  ecuaciones  de  primer  grado  con  una  incógnita_prof.grettel...Práctica  de  ecuaciones  de  primer  grado  con  una  incógnita_prof.grettel...
Práctica de ecuaciones de primer grado con una incógnita_prof.grettel...Prof.Grettel _mate
 
Introducción a los límites con geogebra
Introducción a los límites con geogebraIntroducción a los límites con geogebra
Introducción a los límites con geogebraMario Suárez
 
Solution game 3eso_-_equation_sheet_with_denominators
Solution game 3eso_-_equation_sheet_with_denominatorsSolution game 3eso_-_equation_sheet_with_denominators
Solution game 3eso_-_equation_sheet_with_denominatorsalzambra
 
Denoising Diffusion Probabilistic Modelsの重要な式の解説
Denoising Diffusion Probabilistic Modelsの重要な式の解説Denoising Diffusion Probabilistic Modelsの重要な式の解説
Denoising Diffusion Probabilistic Modelsの重要な式の解説Tomonari Masada
 
Supplementary material for my following paper: Extraction of Topic Evolutions...
Supplementary material for my following paper: Extraction of Topic Evolutions...Supplementary material for my following paper: Extraction of Topic Evolutions...
Supplementary material for my following paper: Extraction of Topic Evolutions...Tomonari Masada
 
Contoh Soal Fungsi (Operasi Aljabar dan Komposisi Fungsi)
Contoh Soal Fungsi (Operasi Aljabar dan Komposisi Fungsi)Contoh Soal Fungsi (Operasi Aljabar dan Komposisi Fungsi)
Contoh Soal Fungsi (Operasi Aljabar dan Komposisi Fungsi)siska sri asali
 
Transformada de laplace
Transformada de laplaceTransformada de laplace
Transformada de laplaceOscar Arizaj
 
Càlcul numèric nombres enters
Càlcul numèric nombres entersCàlcul numèric nombres enters
Càlcul numèric nombres entersrrodri83
 
Wymierne
WymierneWymierne
WymierneAnnagp3
 
203 bai-tap-gioi-han-www.mathvn.com
203 bai-tap-gioi-han-www.mathvn.com203 bai-tap-gioi-han-www.mathvn.com
203 bai-tap-gioi-han-www.mathvn.comkim24101996
 

Mais procurados (20)

Ejercicios de cálculo diferencial
Ejercicios de cálculo diferencialEjercicios de cálculo diferencial
Ejercicios de cálculo diferencial
 
Ch02 24
Ch02 24Ch02 24
Ch02 24
 
Wilder ejercicios unidad 5
Wilder ejercicios unidad 5Wilder ejercicios unidad 5
Wilder ejercicios unidad 5
 
Limites RESUELTOS
Limites RESUELTOSLimites RESUELTOS
Limites RESUELTOS
 
Ejercicios inecuaciones
Ejercicios inecuacionesEjercicios inecuaciones
Ejercicios inecuaciones
 
Latihan integral parsial
Latihan  integral parsial Latihan  integral parsial
Latihan integral parsial
 
Práctica de ecuaciones de primer grado con una incógnita_prof.grettel...
Práctica  de  ecuaciones  de  primer  grado  con  una  incógnita_prof.grettel...Práctica  de  ecuaciones  de  primer  grado  con  una  incógnita_prof.grettel...
Práctica de ecuaciones de primer grado con una incógnita_prof.grettel...
 
Introducción a los límites con geogebra
Introducción a los límites con geogebraIntroducción a los límites con geogebra
Introducción a los límites con geogebra
 
Solution game 3eso_-_equation_sheet_with_denominators
Solution game 3eso_-_equation_sheet_with_denominatorsSolution game 3eso_-_equation_sheet_with_denominators
Solution game 3eso_-_equation_sheet_with_denominators
 
Factorizacion
FactorizacionFactorizacion
Factorizacion
 
Denoising Diffusion Probabilistic Modelsの重要な式の解説
Denoising Diffusion Probabilistic Modelsの重要な式の解説Denoising Diffusion Probabilistic Modelsの重要な式の解説
Denoising Diffusion Probabilistic Modelsの重要な式の解説
 
Ejercicios de limites
Ejercicios de limitesEjercicios de limites
Ejercicios de limites
 
Supplementary material for my following paper: Extraction of Topic Evolutions...
Supplementary material for my following paper: Extraction of Topic Evolutions...Supplementary material for my following paper: Extraction of Topic Evolutions...
Supplementary material for my following paper: Extraction of Topic Evolutions...
 
Contoh Soal Fungsi (Operasi Aljabar dan Komposisi Fungsi)
Contoh Soal Fungsi (Operasi Aljabar dan Komposisi Fungsi)Contoh Soal Fungsi (Operasi Aljabar dan Komposisi Fungsi)
Contoh Soal Fungsi (Operasi Aljabar dan Komposisi Fungsi)
 
Transformada de laplace
Transformada de laplaceTransformada de laplace
Transformada de laplace
 
Càlcul numèric nombres enters
Càlcul numèric nombres entersCàlcul numèric nombres enters
Càlcul numèric nombres enters
 
Wymierne
WymierneWymierne
Wymierne
 
Ch11 25
Ch11 25Ch11 25
Ch11 25
 
Ims
ImsIms
Ims
 
203 bai-tap-gioi-han-www.mathvn.com
203 bai-tap-gioi-han-www.mathvn.com203 bai-tap-gioi-han-www.mathvn.com
203 bai-tap-gioi-han-www.mathvn.com
 

Destaque

minig facts
minig factsminig facts
minig factsmvafa_65
 
Album De Fotos
Album De FotosAlbum De Fotos
Album De Fotosingcamilom
 
Folder da trilha sem data
Folder da trilha   sem dataFolder da trilha   sem data
Folder da trilha sem dataTiago Paiva
 
Records Mundiais
Records MundiaisRecords Mundiais
Records MundiaisPortal3d
 
Chaukanna News 5 april to 11 aparil 2013
Chaukanna News 5 april to 11 aparil 2013Chaukanna News 5 april to 11 aparil 2013
Chaukanna News 5 april to 11 aparil 2013Danish Khan
 
Pesquisa do 3.º C - Os Animais
Pesquisa do 3.º C - Os AnimaisPesquisa do 3.º C - Os Animais
Pesquisa do 3.º C - Os Animaiscatarina01
 
Tema 4 MySQL básico 1
Tema 4 MySQL básico 1Tema 4 MySQL básico 1
Tema 4 MySQL básico 1Edna Rheiner
 
Proyecto articulacion
Proyecto articulacionProyecto articulacion
Proyecto articulacionHENRY OSORIO
 
Memahami tentang kimia
Memahami tentang kimiaMemahami tentang kimia
Memahami tentang kimiaEKO SUPRIYADI
 
Dicionario comunicacao marcondes3
Dicionario comunicacao marcondes3Dicionario comunicacao marcondes3
Dicionario comunicacao marcondes3babilins
 
Catálogo do 6º Leilão Virtual da Fazenda Cruzeiro acontece dia 30 de maio
Catálogo do 6º Leilão Virtual da Fazenda Cruzeiro acontece dia 30 de maioCatálogo do 6º Leilão Virtual da Fazenda Cruzeiro acontece dia 30 de maio
Catálogo do 6º Leilão Virtual da Fazenda Cruzeiro acontece dia 30 de maioAgriPoint
 
El Deporte En Edad Escolar En Andalucia
El Deporte En Edad Escolar En AndaluciaEl Deporte En Edad Escolar En Andalucia
El Deporte En Edad Escolar En AndaluciaFapace Almería
 

Destaque (20)

minig facts
minig factsminig facts
minig facts
 
Test1
Test1Test1
Test1
 
Album De Fotos
Album De FotosAlbum De Fotos
Album De Fotos
 
itanhaem proinfo aula 4
itanhaem proinfo aula 4itanhaem proinfo aula 4
itanhaem proinfo aula 4
 
Capitulo 1.5
Capitulo 1.5Capitulo 1.5
Capitulo 1.5
 
Folder da trilha sem data
Folder da trilha   sem dataFolder da trilha   sem data
Folder da trilha sem data
 
Records Mundiais
Records MundiaisRecords Mundiais
Records Mundiais
 
Chaukanna News 5 april to 11 aparil 2013
Chaukanna News 5 april to 11 aparil 2013Chaukanna News 5 april to 11 aparil 2013
Chaukanna News 5 april to 11 aparil 2013
 
Manual de instalaccion de wordpress
Manual de instalaccion de wordpressManual de instalaccion de wordpress
Manual de instalaccion de wordpress
 
Pesquisa do 3.º C - Os Animais
Pesquisa do 3.º C - Os AnimaisPesquisa do 3.º C - Os Animais
Pesquisa do 3.º C - Os Animais
 
Groovy
GroovyGroovy
Groovy
 
Tema 4 MySQL básico 1
Tema 4 MySQL básico 1Tema 4 MySQL básico 1
Tema 4 MySQL básico 1
 
Proyecto articulacion
Proyecto articulacionProyecto articulacion
Proyecto articulacion
 
Kantaen, sävellys
Kantaen, sävellysKantaen, sävellys
Kantaen, sävellys
 
Memahami tentang kimia
Memahami tentang kimiaMemahami tentang kimia
Memahami tentang kimia
 
Aves da mata atlântica
Aves da mata atlânticaAves da mata atlântica
Aves da mata atlântica
 
Dicionario comunicacao marcondes3
Dicionario comunicacao marcondes3Dicionario comunicacao marcondes3
Dicionario comunicacao marcondes3
 
Hoja de vida dr. sanchez
Hoja de vida dr. sanchezHoja de vida dr. sanchez
Hoja de vida dr. sanchez
 
Catálogo do 6º Leilão Virtual da Fazenda Cruzeiro acontece dia 30 de maio
Catálogo do 6º Leilão Virtual da Fazenda Cruzeiro acontece dia 30 de maioCatálogo do 6º Leilão Virtual da Fazenda Cruzeiro acontece dia 30 de maio
Catálogo do 6º Leilão Virtual da Fazenda Cruzeiro acontece dia 30 de maio
 
El Deporte En Edad Escolar En Andalucia
El Deporte En Edad Escolar En AndaluciaEl Deporte En Edad Escolar En Andalucia
El Deporte En Edad Escolar En Andalucia
 

Mais de Tomonari Masada

Learning Latent Space Energy Based Prior Modelの解説
Learning Latent Space Energy Based Prior Modelの解説Learning Latent Space Energy Based Prior Modelの解説
Learning Latent Space Energy Based Prior Modelの解説Tomonari Masada
 
Context-dependent Token-wise Variational Autoencoder for Topic Modeling
Context-dependent Token-wise Variational Autoencoder for Topic ModelingContext-dependent Token-wise Variational Autoencoder for Topic Modeling
Context-dependent Token-wise Variational Autoencoder for Topic ModelingTomonari Masada
 
A note on the density of Gumbel-softmax
A note on the density of Gumbel-softmaxA note on the density of Gumbel-softmax
A note on the density of Gumbel-softmaxTomonari Masada
 
トピックモデルの基礎と応用
トピックモデルの基礎と応用トピックモデルの基礎と応用
トピックモデルの基礎と応用Tomonari Masada
 
Expectation propagation for latent Dirichlet allocation
Expectation propagation for latent Dirichlet allocationExpectation propagation for latent Dirichlet allocation
Expectation propagation for latent Dirichlet allocationTomonari Masada
 
Mini-batch Variational Inference for Time-Aware Topic Modeling
Mini-batch Variational Inference for Time-Aware Topic ModelingMini-batch Variational Inference for Time-Aware Topic Modeling
Mini-batch Variational Inference for Time-Aware Topic ModelingTomonari Masada
 
A note on variational inference for the univariate Gaussian
A note on variational inference for the univariate GaussianA note on variational inference for the univariate Gaussian
A note on variational inference for the univariate GaussianTomonari Masada
 
Document Modeling with Implicit Approximate Posterior Distributions
Document Modeling with Implicit Approximate Posterior DistributionsDocument Modeling with Implicit Approximate Posterior Distributions
Document Modeling with Implicit Approximate Posterior DistributionsTomonari Masada
 
LDA-Based Scoring of Sequences Generated by RNN for Automatic Tanka Composition
LDA-Based Scoring of Sequences Generated by RNN for Automatic Tanka CompositionLDA-Based Scoring of Sequences Generated by RNN for Automatic Tanka Composition
LDA-Based Scoring of Sequences Generated by RNN for Automatic Tanka CompositionTomonari Masada
 
A Note on Latent LSTM Allocation
A Note on Latent LSTM AllocationA Note on Latent LSTM Allocation
A Note on Latent LSTM AllocationTomonari Masada
 
Topic modeling with Poisson factorization (2)
Topic modeling with Poisson factorization (2)Topic modeling with Poisson factorization (2)
Topic modeling with Poisson factorization (2)Tomonari Masada
 
A Simple Stochastic Gradient Variational Bayes for the Correlated Topic Model
A Simple Stochastic Gradient Variational Bayes for the Correlated Topic ModelA Simple Stochastic Gradient Variational Bayes for the Correlated Topic Model
A Simple Stochastic Gradient Variational Bayes for the Correlated Topic ModelTomonari Masada
 
A Simple Stochastic Gradient Variational Bayes for Latent Dirichlet Allocation
A Simple Stochastic Gradient Variational Bayes for Latent Dirichlet AllocationA Simple Stochastic Gradient Variational Bayes for Latent Dirichlet Allocation
A Simple Stochastic Gradient Variational Bayes for Latent Dirichlet AllocationTomonari Masada
 
Word count in Husserliana Volumes 1 to 28
Word count in Husserliana Volumes 1 to 28Word count in Husserliana Volumes 1 to 28
Word count in Husserliana Volumes 1 to 28Tomonari Masada
 
A Simple Stochastic Gradient Variational Bayes for Latent Dirichlet Allocation
A Simple Stochastic Gradient Variational Bayes for Latent Dirichlet AllocationA Simple Stochastic Gradient Variational Bayes for Latent Dirichlet Allocation
A Simple Stochastic Gradient Variational Bayes for Latent Dirichlet AllocationTomonari Masada
 
A derivation of the sampling formulas for An Entity-Topic Model for Entity Li...
A derivation of the sampling formulas for An Entity-Topic Model for Entity Li...A derivation of the sampling formulas for An Entity-Topic Model for Entity Li...
A derivation of the sampling formulas for An Entity-Topic Model for Entity Li...Tomonari Masada
 

Mais de Tomonari Masada (20)

Learning Latent Space Energy Based Prior Modelの解説
Learning Latent Space Energy Based Prior Modelの解説Learning Latent Space Energy Based Prior Modelの解説
Learning Latent Space Energy Based Prior Modelの解説
 
Context-dependent Token-wise Variational Autoencoder for Topic Modeling
Context-dependent Token-wise Variational Autoencoder for Topic ModelingContext-dependent Token-wise Variational Autoencoder for Topic Modeling
Context-dependent Token-wise Variational Autoencoder for Topic Modeling
 
A note on the density of Gumbel-softmax
A note on the density of Gumbel-softmaxA note on the density of Gumbel-softmax
A note on the density of Gumbel-softmax
 
トピックモデルの基礎と応用
トピックモデルの基礎と応用トピックモデルの基礎と応用
トピックモデルの基礎と応用
 
Expectation propagation for latent Dirichlet allocation
Expectation propagation for latent Dirichlet allocationExpectation propagation for latent Dirichlet allocation
Expectation propagation for latent Dirichlet allocation
 
Mini-batch Variational Inference for Time-Aware Topic Modeling
Mini-batch Variational Inference for Time-Aware Topic ModelingMini-batch Variational Inference for Time-Aware Topic Modeling
Mini-batch Variational Inference for Time-Aware Topic Modeling
 
A note on variational inference for the univariate Gaussian
A note on variational inference for the univariate GaussianA note on variational inference for the univariate Gaussian
A note on variational inference for the univariate Gaussian
 
Document Modeling with Implicit Approximate Posterior Distributions
Document Modeling with Implicit Approximate Posterior DistributionsDocument Modeling with Implicit Approximate Posterior Distributions
Document Modeling with Implicit Approximate Posterior Distributions
 
LDA-Based Scoring of Sequences Generated by RNN for Automatic Tanka Composition
LDA-Based Scoring of Sequences Generated by RNN for Automatic Tanka CompositionLDA-Based Scoring of Sequences Generated by RNN for Automatic Tanka Composition
LDA-Based Scoring of Sequences Generated by RNN for Automatic Tanka Composition
 
A Note on ZINB-VAE
A Note on ZINB-VAEA Note on ZINB-VAE
A Note on ZINB-VAE
 
A Note on Latent LSTM Allocation
A Note on Latent LSTM AllocationA Note on Latent LSTM Allocation
A Note on Latent LSTM Allocation
 
A Note on TopicRNN
A Note on TopicRNNA Note on TopicRNN
A Note on TopicRNN
 
Topic modeling with Poisson factorization (2)
Topic modeling with Poisson factorization (2)Topic modeling with Poisson factorization (2)
Topic modeling with Poisson factorization (2)
 
Poisson factorization
Poisson factorizationPoisson factorization
Poisson factorization
 
A Simple Stochastic Gradient Variational Bayes for the Correlated Topic Model
A Simple Stochastic Gradient Variational Bayes for the Correlated Topic ModelA Simple Stochastic Gradient Variational Bayes for the Correlated Topic Model
A Simple Stochastic Gradient Variational Bayes for the Correlated Topic Model
 
A Simple Stochastic Gradient Variational Bayes for Latent Dirichlet Allocation
A Simple Stochastic Gradient Variational Bayes for Latent Dirichlet AllocationA Simple Stochastic Gradient Variational Bayes for Latent Dirichlet Allocation
A Simple Stochastic Gradient Variational Bayes for Latent Dirichlet Allocation
 
Word count in Husserliana Volumes 1 to 28
Word count in Husserliana Volumes 1 to 28Word count in Husserliana Volumes 1 to 28
Word count in Husserliana Volumes 1 to 28
 
A Simple Stochastic Gradient Variational Bayes for Latent Dirichlet Allocation
A Simple Stochastic Gradient Variational Bayes for Latent Dirichlet AllocationA Simple Stochastic Gradient Variational Bayes for Latent Dirichlet Allocation
A Simple Stochastic Gradient Variational Bayes for Latent Dirichlet Allocation
 
FDSE2015
FDSE2015FDSE2015
FDSE2015
 
A derivation of the sampling formulas for An Entity-Topic Model for Entity Li...
A derivation of the sampling formulas for An Entity-Topic Model for Entity Li...A derivation of the sampling formulas for An Entity-Topic Model for Entity Li...
A derivation of the sampling formulas for An Entity-Topic Model for Entity Li...
 

A Note on Sparse Stochastic Inference for Latent Dirichlet Allocation

  • 1. A derivation of Eqs. (4) and (5) of Sparse stochastic inference for latent Dirichlet allocation Tomonari MASADA @ Nagasaki University May 23, 2013 The evidence can be written as follows: p(w|α, η) = z k p(βk|η) d p(θd|α)p(zd|θd)p(w|zd, β) dθdβ . (1) By integrating θ out, we have p(w|α, η) = z k p(βk|η) d p(zd|α)p(w|zd, β) dβ . (2) By applying Jensen’s inequality, we have a lower bound of the evidence as follows: log p(w|α, η) = log z k p(βk|η) d p(zd|α)p(w|zd, β)dβ = log z d q(zd) k q(βk) k p(βk|η) d p(zd|α)p(w|zd, β) d q(zd) k q(βk) dβ ≥ z d q(zd) k q(βk) log k p(βk|η) d p(zd|α)p(w|zd, β) d q(zd) k q(βk) dβ = k q(βk) log p(βk|η)dβk + d zd q(zd) log p(zd|α) + k q(βk) d zd q(zd) log p(w|zd, β)dβ + H(q) = k q(βk) log p(βk|η)dβk + d zd q(zd) log p(zd|α) + k q(βk) d zd q(zd) Nd i=1 log βzdiwdi dβ + H(q) , (3) where H(q) = k q(βk) log q(βk)dβk + d zd q(zd) log q(zd). Let L denote the lower bound in Eq. (3). By picking up the terms related to zd from L, we define Lzd as follows: Lzd = zd q(zd) log p(zd|α) + k q(βk) zd q(zd) Nd i=1 log βzdiwdi dβ − zd q(zd) log q(zd) . (4) We obtain a functional derivative of Lzd with respect to q(zd) as follows: δLzd δq(zd) = lim →0 zd {q(zd) + δ(zd − zd)} log p(zd|α) − zd q(zd) log p(zd|α) + lim →0 k q(βk) zd {q(zd) + δ(zd − zd)} Nd i=1 log βzdiwdi − zd q(zd) Nd i=1 log βzdiwdi dβ − lim →0 zd {q(zd) + δ(zd − zd)} log{q(zd) + δ(zd − zd)} − zd q(zd) log q(zd) , (5) 1
  • 2. where lim →0 zd {q(zd) + δ(zd − zd)} log{q(zd) + δ(zd − zd)} − zd q(zd) log q(zd) = lim →0 zd q(zd) log q(zd)+ δ(zd−zd) q(zd) + zd δ(zd − zd) log{q(zd) + δ(zd − zd)} = lim →0 zd q(zd) δ(zd−zd) q(zd) + O( 2 ) + lim →0 zd δ(zd − zd) log{q(zd) + δ(zd − zd)} = zd δ(zd − zd) + zd δ(zd − zd) log q(zd) = 1 + log q(zd) . (6) Therefore, δLzd δq(zd) = log p(zd|α) + k q(βk) Nd i=1 log βzdiwdi dβ − 1 − log q(zd) (7) By solving δLzd δq(zd) = 0, we obtain q(zd) ∝ p(zd|α) · exp k q(βk) Nd i=1 log βzdiwdi dβ = p(zd|α) · Nd i=1 exp k q(βk) log βzdiwdi dβ ∝ Γ(Kα) Γ(Kα + Nd) k Γ(α + i Izdi=k) Γ(α) × i exp Eq log βzdiwdi (8) We assume that q(βk) = Γ( w λkw) w Γ(λkw) w βλkw−1 kw . By picking up the terms related to λ from L, we define Lλ as follows: Lλ = k q(βk) log p(βk|η)dβk + k q(βk) d zd q(zd) Nd i=1 log βzdiwdi dβ − k q(βk) log q(βk)dβk . (9) Each term in Eq. (9) can be rewritten as below. q(βk) log p(βk|η)dβk = log Γ(Wη) − w log Γ(η) + w (η − 1) Ψ(λkw) − Ψ( w λkw) (10) q(βk) log q(βk)dβk = log Γ( w λkw) − w log Γ(λkw) + w (λkw − 1) Ψ(λkw) − Ψ( w λkw) (11) k q(βk) d zd q(zd) Nd i=1 log βzdiwdi dβ = k q(βk) d zd q(zd) Nd i=1 k w I(zdi = k, wdi = w) · log βkw dβ = k q(βk) k w log βkw d zd q(zd) Nd i=1 I(zdi = k, wdi = w) dβ = k w Ψ(λkw) − Ψ( w λkw) d zd q(zd) Nd i=1 I(zdi = k, wdi = w) (12) 2
  • 3. Therefore, ∂Lλ ∂λkw = η − λkw + d zd q(zd) Nd i=1 I(zdi = k, wdi = w) Ψ (λkw) − η − λkw + d zd q(zd) Nd i=1 I(zdi = k, wdi = w) Ψ ( w λkw) . (13) By solving ∂Lλ ∂λkw = 0, we obtain λkw = η + d zd q(zd) Nd i=1 I(zdi = k, wdi = w) . (14) 3