条件概率的边缘化

机器算法验证 条件概率 贝叶斯网络 边际分布
2022-03-20 08:33:07

我正在研究贝叶斯网络上的这些计算示例,并遇到了这种说法(最后一个示例计算的一部分):

P(E=e|A=a)=cCP(E=e,C=c|A=a)

我新近熟悉边缘化,但我认为它是:

P(A=a)=bBP(A=a,B=b)=bBP(A=a|B=b)P(B=b)

如果第一个等式是真的,有人可以解释吗?我曾尝试搜索“边缘化条件概率”,但没有找到任何看起来相似的东西。

2个回答

根据条件概率*的定义,我们有:

P(E=e|A=a)=P(E=e,A=a)P(A=a)=cP(E=e,C=c,A=a)P(A=a)

在最后一步中,我使用了边缘化c. 然后,再次使用条件概率的定义,这等于:

cP(E=e,C=c|A=a)
.

*条件概率的定义:

P(x1,...,xn|y1,...,ym)=P(x1,...,xn,y1,...,ym)P(y1,...,ym)

条件概率是一种概率度量,意味着它们满足概率公理,并享有(无条件)概率的所有属性。

这种说法的实际用途是,如果假设一切都以某个事件的发生为条件,那么您所了解的有关概率的任何规则、定理或公式也适用。例如,知道

P(Bc)=1P(B)
让我们可以立即得出结论
P(BcA)=1P(BA)
是一个有效的结果,无需写出正式的定义并完成结果的证明。所以把这个想法应用到公式中
P(E)=iP(ECi)
在哪里C1,C2,是样本空间的一个分区Ω 成不相交的子集(等等(EC1),(EC2),一个分区E成不相交的子集)。调节一切A给我们
P(EA)=iP(ECiA)
这是您的公式,符号略有不同。