我可以在不影响马尔可夫性的情况下更改随机游走 MH MCMC 中的提案分布吗?

机器算法验证 马尔可夫链蒙特卡罗 大都会黑斯廷斯
2022-02-09 13:15:21

具有对称提议的随机游走 Metropolis-Hasitings

q(x|y)=g(|yx|) 具有接受概率的性质

P(accept y)=min{1,f(y)/f(x)}

不依赖于提案g()

这是否意味着我可以将g()更改为链先前性能的函数,而不会影响链的马尔可夫性?

我特别感兴趣的是根据接受率调整 Normal 提案的缩放比例。

如果有人能指出在实践中用于此类问题的适应算法,我将不胜感激。

非常感谢。

[编辑:从 robertsy 和 wok 给出的参考资料开始,我发现以下关于 MH 自适应算法的参考资料:

Andrieu、Christophe 和 Éric Moulines。2006.
关于一些自适应 MCMC 算法的遍历性。应用概率年鉴 16,没有。3:1462-1505。http://www.jstor.org/stable/25442804

安德里厄、克里斯托夫和约翰内斯·汤姆斯。
2008. 自适应 MCMC 教程。统计与计算 18,没有。4 (12): 343-373。doi:10.1007/s11222-008-9110-y。链接

Atchadé, Y.、G. Fort、E. Moulines 和 P. Priouret。2009.
自适应马尔可夫链蒙特卡罗:理论和方法。预印本。

阿查德,伊夫。2010.
一些具有子几何内核的自适应 MCMC 算法的极限定理。伯努利 16,没有。1(二月):116-154。doi:10.3150/09-BEJ199。 http://projecteuclid.org/DPubS?verb=Display&version=1.0&service=UI&handle=euclid.bj/1265984706&page=record

Cappe、O.、S. J Godsill 和 E. Moulines。2007.
现有方法的概述和顺序蒙特卡洛的最新进展。IEEE 95 的会议记录,没有。5:899-924。

佐丹尼,保罗。2010.
通过快速估计法线混合的自适应独立大都市黑斯廷斯。计算和图形统计杂志 19,没有。2 (6): 243-259。doi:10.1198/jcgs.2009.07174。http://pubs.amstat.org/doi/abs/10.1198/jcgs.2009.07174

Latuszynski、Krzysztof、Gareth O Roberts 和 Jeffrey S Rosenthal。2011.
自适应 Gibbs 采样器和相关的 MCMC 方法。1101.5838(1 月 30 日)。http://arxiv.org/abs/1101.5838

Pasarica, C. 和 A. Gelman。2009.
使用预期平方跳跃距离自适应缩放 Metropolis 算法。中央统计。

Roberts, Gareth O. 2009。
自适应 MCMC 示例。计算和图形统计杂志 18,没有。2 (6): 349-367。doi:10.1198/jcgs.2009.06134。http://pubs.amstat.org/doi/abs/10.1198/jcgs.2009.06134

]

4个回答

我认为 Heikki Haario 等人的这篇论文会给你你需要的答案。链的马尔可夫性受提议密度适应的影响,因为这样一个新的提议值不仅取决于前一个值,还取决于整个链。但是,如果非常小心,该序列似乎仍然具有良好的特性。

您可以使用Tierney, Mira (1999)中所述的延迟拒绝来提高接受率它基于第二个提议函数和第二个接受概率,这保证马尔可夫链在相同的不变分布下仍然是可逆的:你必须小心,因为“很容易构建看似可行但实际上的自适应方法来自错误分布的样本”。

用户 wok 和 robertsy 建议的方法涵盖了我所知道的最常引用的示例。为了扩展这些答案,Haario 和 Mira 在 2006 年写了一篇论文,结合了这两种方法,他们称之为DRAM(延迟拒绝自适应 Metropolis)

Andrieu对各种不同的自适应 MCMC 方法(pdf) 进行了很好的处理,其中涵盖了 Haario 2001,但也讨论了近年来提出的各种替代方案。

这有点像我的出版物的无耻插件,但我们这项工作( arxiv )中正是这样做的。除其他事项外,我们建议调整指数分布的方差以提高接受度(本文算法中的步骤 S3.2)。

在我们的例子中,渐近地适应不会改变提案分布(在论文中是当时)。因此,渐近地,该过程仍然是与Wang-Landau 算法相同的马尔可夫算法我们在数值上验证了该过程是遍历的,并且来自我们选择的目标分布的链样本(例如图 4 的左下图)。f1

我们不使用有关接受率的信息,但我们获得了与我们感兴趣的数量无关的接受(相当于自旋系统的能量,图 4 的右下角)。