从不适当的后验(密度)采样f从概率/理论的角度来看是没有意义的。原因是函数f在参数空间上没有有限积分,因此不能链接到(有限测度)概率模型(Ω,σ,P)(空间、sigma 代数、概率测度)。
如果您的模型具有不正确的先验导致不正确的后验,在许多情况下您仍然可以使用 MCMC 从中采样,例如 Metropolis-Hastings,并且“后验样本”可能看起来合理。乍一看,这看起来很有趣且自相矛盾。然而,这样做的原因是 MCMC 方法在实践中受限于计算机的数值限制,因此,所有支持对于计算机来说都是有界的(并且是离散的!)。然后,在这些限制(有界性和离散性)下,后验在大多数情况下实际上是正确的。
Hobert 和 Casella 提供了一个很好的参考资料,其中提供了一个示例(性质略有不同),您可以在其中为后验构造一个 Gibbs 采样器,后验样本看起来非常合理,但后验不合适!
http://www.jstor.org/stable/2291572
最近出现了一个类似的例子。事实上,Hobert 和 Casella 警告读者,MCMC 方法不能用于检测后验的不当,并且在实施任何 MCMC 方法之前必须单独检查。总之:
- 一些 MCMC 采样器,例如 Metropolis-Hastings,可以(但不应该)用于从不正确的后验中采样,因为计算机会限制和离散化参数空间。只有拥有大量样本,才能观察到一些奇怪的东西。检测这些问题的能力还取决于采样器中使用的“乐器”分布。后一点需要更广泛的讨论,所以我宁愿把它留在这里。
- (霍伯特和卡塞拉)。您可以为具有不正确先验的模型构建 Gibbs 采样器(条件模型)这一事实并不意味着后验(联合模型)是正确的。
- 后验样本的正式概率解释需要后验的适当性。仅针对适当的概率分布/度量建立收敛结果和证明。
PS(有点开玩笑):不要总是相信人们在机器学习中所做的事情。正如 Brian Ripley 教授所说:“机器学习是统计数据减去对模型和假设的任何检查”。