贝叶斯的顺序更新

机器算法验证 机器学习 贝叶斯
2022-03-25 08:44:05

我目前正在阅读墨菲的 ML: A Probabilistic Perspective。在第 3 章中,他解释说后验的批量更新等同于后验的顺序更新,我试图在他的示例中理解这一点。

认为DaDb是两个数据集和θ是我们模型的参数。我们正在尝试更新后验P(θDa,Db). 在连续更新中,他指出,

(1)        P(θDa,Db)P(Dbθ)P(θDa)
但是,我对他如何在数学上得到这个有点困惑。从概念上讲,我理解他说的是后验P(θDa)现在是用于更新新后验的先验,其中包括新数据Db,并将此先验乘以可能性P(Dbθ). 扩展最后一条语句,我有,
P(Dbθ)P(θDa)=P(Dbθ)P(Daθ)P(θ)

但是我们可以说P(Daθ)P(Dbθ)=P(Da,Dbθ)为了在(1)中建立连接?

2个回答

确实 - 只要您假设可交换性,您就可以按顺序或以批量方式更新。这类似于频率论模型中通常做出的独立同分布假设

在这种情况下,DaDb可交换意味着P(Da,Db|θ)=P(Da|θ)P(Db|θ)对于一些θ,这正是您建立连接所需要的。

您可以看到单个之间的等价证明n- 大批量更新和n我写给类似问题的答案中的顺序更新。

实际上,顺序贝叶斯更新的一般公式是:

P(θDa,Db)P(Dbθ,Da)P(θDa).()
然而,对于大多数机器学习模型, DaDb是有条件独立给定的θ, IE,
P(Daθ)P(Dbθ)=P(Da,Dbθ),
然后,P(Dbθ,Da)()自然等于P(Dbθ), 所以()变成:
(1)P(θDa,Db)P(Dbθ)P(θDa),
这正是墨菲的 ML 书中所谈论的内容。