2. LDA
• LDAの推論では潜在変数������������������ に関して、条件付
������������������ +������
き確率������ ������������������ = ������ … ∝ (������������������ + ������)を
������������ +������������
計算する
– T. L. Griffiths and M. Steyvers. Finding scientific
topics. In PNAS, 101, pp. 5228—5235, 2004
• トピック数Kが多いときに各トピックに対して確
率を計算するのはコストが高い
3. cf:既存の高速化手法
• Ian Porteous, David Newman, Alexander Ihler,
Arthur Asuncion, Padhraic Smyth and Max
Welling. Fast Collapsed Gibbs Sampling For Latent
Dirichlet Allocation, In SIGKDD, 2008
– 最大10倍ぐらいの高速化
• Limin Yao, David Mimno and Andrew McCallum.
Efficient Methods for Topic Model Inference on
Streaming Document Collections, In SIGKDD,
2009
– 最大20倍ぐらいの高速化