机器算法验证 - 我们如何验证这样的直觉：在 RW-Metropolis-Hastings 算法中，高斯提议太小和太大的方差都是不好的选择 - 吾爱随笔录

机器算法验证马尔可夫链蒙特卡罗马尔科夫过程大都会黑斯廷斯随机游走最佳缩放

2022-04-13 15:25:38

让 $d\in\mathbb N$ 并考虑具有高斯提议内核的随机游走 Metropolis-Hastings 算法 $Q$ 这样 $Q(x,\;\cdot\;)=\mathcal N_d(x,\sigma^2_dI_d)$ 对所有人 $x\in\mathbb R^d$ .

直觉上，如果 $\sigma$ 太小，几乎所有的提案都会被接受，并且链条移动非常缓慢。另一方面，如果 $\sigma$ 太大，建议的移动通常会远离当前状态，因此大多数建议将被拒绝。

考虑到这一点，建模是有意义的 $\sigma_d$ 作为的减函数 $d$ . 我们可以设置 $\sigma_d=\ell/d^\alpha$ 对于一些 $\alpha\in[0,1]$ . 在他作品的第 6 页（论文编号），罗伯茨提到选择 $\alpha=1/2$ 是“最佳的”（在什么意义上？）。

我们如何严格地证明这一点？

我发现的演示文稿的幻灯片 18似乎是相关的，但我不明白他们是如何得出结论的

1个回答

Gareth Roberts 等人的原始方法。是研究第一个坐标过程的极限分布 $X^{(1)}_n$ , 加速了一个因素 $d$ . 这导致了限制过程 $Z_t = X^{(1)}_{\lfloor t d \rfloor}$ .

这是其中的方式 $\alpha = 1/2$ 可以认为是最优选择。有关此结果的更准确的陈述和证明，请参阅非常易读的原始研究论文。

Roberts, GO, Gelman, A., & Gilks, WR (1997)。随机游走 Metropolis 算法的弱收敛和最优缩放。应用概率年鉴，7（1），110-120。https://doi.org/10.1214/aoap/1034625254

结果随后以各种方式扩展：例如查看高维过程的不同函数（而不是第一个坐标），以及更一般的分布假设。还研究了不同的 Metropolis-Hastings 算法，例如 MALA 算法，它被证明只需要时间加速 $d^{1/3}$ 代替 $d$ 为了收敛。您正在阅读的调查报告中也对此进行了讨论。

其它你可能感兴趣的问题