pLSA的数学模型推导

机器算法验证 机器学习 可能性 贝叶斯 多层次分析 潜在语义分析
2022-03-27 13:06:09

在了解 LSA 的工作原理后,我继续阅读 pLSA,但无法真正理解数学公式。这是我从维基百科得到的(其他学术论文/教程显示类似的形式)

P(w,d)=cP(c)P(d|c)P(w|c)=P(d)cP(c|d)P(w|c)

我放弃了推导它,而是找到了这个

P(c|d)=P(d|c)P(c)P(d)P(c|d)P(d)=P(d|c)P(c)P(w|c)P(c|d)P(d)=P(w|c)P(d|c)P(c)P(d)cP(w|c)P(c|d)=cP(w|c)P(d|c)P(c)

总和如何出现在最后一行?我目前正在阅读一些关于贝叶斯推理的教程(之前学习了基本的概率规则和贝叶斯定理,但在这里看不到它们足够有用)。

2个回答

我假设你想得出:

P(w,d)=cP(c)P(d|c)P(w|c)=P(d)cP(c|d)P(w|c)

此外,这类似于概率潜在语义索引(参见 Blei、Jordan 和 Ng (2003) Latent Dirichlet Allocation. JMLR 第 4.3 节)。PLSI 假设文档标签和单词在给定未观察到的主题的情况下是条件独立的。dwz

如果这是真的,那么您的公式就是贝叶斯定理的简单结果。以下是步骤:

P(w,d)=zP(w,z,d)=zP(w,d|z)p(z)=zP(w|z)p(d|z)p(z),
其中因式分解为产品是因为条件独立。

现在再次使用贝叶斯定理得到

zP(w|z)p(d|z)p(z)=zP(w|z)p(z,d)=zP(w|z)p(z|d)p(d)=p(d)zP(w|z)p(z|d)

线P(c|d)P(c)=P(d|c)P(c)(你的 eq 2)应该是P(c|d)P(d)=P(d|c)P(c).

我不确定为什么您认为贝叶斯定理和基本概率规则没有用:

等式 1 是贝叶斯定理(即认识到P(d|c)P(c)=P(c,d)并插入条件概率的定义)

等式 2 紧接在等式 1 之后

方程 3 只是 eq 2 乘以P(w|c).

由于 eq 3 适用于所有人c总和是相等的。那么自从w独立于d给定c(来自模型的假设),P(w|c)P(c|d)=P(w|c,d)P(c|d)=P(w,c|d)所以c P(w,c|d)=P(w|d)根据全概率定律,给你P(w|d)P(d).

最后,P(w|d)P(d)=P(w,d)从条件概率的定义。

所以基本概率实际上是推导的必要和充分的!