为什么我们需要 LDA 中的超参数 beta 和 alpha?

数据挖掘 主题模型 低密度脂蛋白 超参数
2021-09-15 19:41:37

我试图了解潜在狄利克雷分配 (LDA) 的技术部分,但我有几个问题:

第一:为什么我们每次对下面的等式进行采样时都需要添加 alpha 和 gamma?如果我们从方程中删除 alpha 和 gamma 怎么办?是否还有可能得到结果?

LDA采样公式

第二:在 LDA 中,我们为文档中的每个单词随机分配一个主题。然后,我们尝试通过观察数据来优化主题。上面等式中与后验推断相关的部分在哪里?

1个回答

LDA 是贝叶斯模型。您给出的方程是模型的后验分布。alpha 和 beta 参数来自狄利克雷分布(beta 分布的推广)将这些作为先验分布中的参数的事实。所以要回答你的第一个问题,上面的公式在没有 alpha 和 gamma 的情况下是否有效,是的,你会隐含地假设这些来自先验分布的参数都等于零。你仍然会得到一个结果,但你使用的先验可能在概念层面上有问题(也许它也会导致一些数字问题,我不确定?)

为了回答问题 2,我想指出,在 LDA 中,我们使用共轭先验来简化最优参数值的计算。这就是你在上面的等式中看到的。您看到的是后验值与左侧成正比。添加“c”项允许您计算后验。