我想从 MCMC 样本中计算对数点预测密度。Gelman et al (2014) 将 lppd 定义为
我的问题是
- 如果我们对所有点数据点求和,为什么将 lppd 称为“逐点”?
- 我是否正确地将其解释为 lppd 与边际似然相同,除了我们边缘化后验分布而不是先验分布的似然性这一事实?再一次,我觉得这个名字有点误导,像边际后验似然对我来说更直观。
- 在我看来,在实践中计算 lppd 的最简单方法是在 MCMC 中记录可能性,然后取这些值的平均值。除了用于记录可能性的内存之外,这种方法有什么缺点吗?
编辑:我只是想指出,在@PITBULL 的回答之后,我现在意识到关键是首先计算每个数据点的一种边际后验似然,然后将这些概率相乘,所以我明白这个名字现在选择,接下来两个问题的答案是“否”和“否”;)
参考:
格尔曼,A。Hwang, J. & Vehtari, A. (2014) 了解贝叶斯模型的预测信息标准。统计。计算机,Springer 美国,24, 997-1016。