用三个变量边缘化概率

机器算法验证 条件概率
2022-04-12 15:12:48

我正在读一本书,看到以下等式:

P(X|θ)=zP(X|z,θ)P(z|θ)
我知道它是:
P(X)=zP(X|z)P(z)
但我不知道上面的条件概率和三个变量的方程是如何成立的。有人能说明我们如何从左侧到右侧吗?

2个回答

如此处所述

如果假设一切都以某个事件的发生为条件,那么您所了解的有关概率的任何规则、定理或公式也适用。例如,知道

P(Bc)=1P(B)
让我们可以立即得出结论
P(BcA)=1P(BA)
是一个有效的结果,无需写出正式的定义并完成结果的证明。

所以,把这个概念应用到你所知道的,即,

P(X)=zP(Xz)P(z)
要得到
P(Xθ)=zP(Xz,θ)P(zθ).
您所做的只是将所有内容都调整为新变量或事件θ.

不相信所有这些高傲的废话吗?然后通过使用所有定义来艰难地解决它:

zP(X|z,θ)P(z|θ)=zP(X,z,θ)P(z,θ)×P(z,θ)P(θ)=zP(X,z,θ)P(θ)=1P(θ)zP(X,z,θ)=P(X,θ)P(θ)=P(Xθ).

一种思考方式,我认为这是更简单的方式,是想象我们可以将任意数量的 RV 添加到概率公式的给定一侧,即我们也有

P(X|θ1,θ2)=zP(X|z,θ1,θ2)P(z|θ1,θ2)

或者,您可以将上述等式的两边与P(θ)并且有

P(X,θ)=zP(X|z,θ)P(z,θ)=zP(X,z,θ)
这实际上是边缘化。