为什么冗余均值参数化会加速 Gibbs MCMC?

机器算法验证 马尔可夫链蒙特卡罗 分层贝叶斯 吉布斯
2022-02-28 09:59:53

在 Gelman & Hill (2007) 的书(使用回归和多级/分层模型的数据分析)中,作者声称包含冗余平均参数可以帮助加速 MCMC。

给定的示例是“飞行模拟器”(Eq 13.9)的非嵌套模型:

yiN(μ+γj[i]+δk[i],σy2)γjN(0,σγ2)δkN(0,σδ2)

他们建议重新参数化,添加平均参数如下:μγμδ

γjN(μγ,σγ2)δkN(μδ,σδ2)

提供的唯一理由是(第 420 页):

模拟可能会陷入整个向量(或)远离零的配置中(即使它们被分配了一个均值为 0 的分布)。最终,模拟将收敛到正确的分布,但我们不想等待。γδ

冗余平均参数如何帮助解决这个问题?

在我看来,非嵌套模型很慢主要是因为是负相关的。(事实上​​,如果一个上升,另一个必须下降,因为它们的总和是由数据“固定”的)。冗余平均参数是否有助于降低之间的相关性,或者完全是其他什么?γδγδ

1个回答

要避免的相关性是之间的相关性。μγjδk

通过将计算模型中的为中心的替代参数,相关性降低了。γjδkμ

请参阅第 25.1 节“什么是分层居中?”以获得非常清晰的描述。在William J. Browne 和其他人 的(免费提供的)书“MLwiN 中的 MCMC 估计”中。http://www.bristol.ac.uk/cmm/software/mlwin/download/manuals.html