马尔可夫链蒙特卡罗中的收敛测试

计算科学 蒙特卡洛 随机
2021-12-02 06:11:43

对于一个相对简单的马尔可夫链蒙特卡罗过程,例如使用 Metropolis 计算 Ising 模型的热平均值,如何确定数量是否收敛?

如果知道自相关时间,这似乎相对简单。您只需在这段时间内运行足够高的倍数,Bob 就是您的叔叔。

如果你不知道自相关时间,它看起来会更复杂。无论您如何努力确保您的平均值已经收敛,它总是有可能陷入局部最小值。如果自相关时间随系统大小呈多项式甚至呈指数级缩放,则这尤其麻烦。

那么如何确保数量真的收敛了呢?哪些收敛测试不会被局部最小值愚弄?我最近在这里读到了关于对数分箱的方法。那能完成这项工作吗?

2个回答

由于您所建议的原因,很难证明统计力学中的集合的收敛性 - 您可能会被困在局部最小值附近,而不是对完整的相空间进行采样。您能做的最好的事情就是证明您的模拟可能会收敛。

但是,您可以进行计算来演示各种属性的自相关。例如,您可以测量能量函数的自相关:或者,您可以使用Flyvbjerg 和 Petersen 的多尺度误差相关方法来确定您的数据样本何时有效地相互去相关,并将其用作确定您是否有足够数据的一种方法(并估计平均值的统计误差您的数据样本)。E(t)E(t+δt)

我还不能发表评论,所以如果有人能把它变成对 aeismail 答案的评论,我将不胜感激。虽然很长。

我无法访问上述 Flyvbjerg 和 Petersen 的论文,因此无法真正判断接下来的内容,但在Grossfield 和 Zuckerman的非常好的论文“量化生物分子模拟中的不确定性和采样质量”中,作者评论道: “这种方法可以简单地描述(尽管从原始参考资料中不容易理解)。” 在我看来,Grossfield 和 Zuckerman 对这个他们称之为“块平均”的过程以及如何获得相关时间的估计给出了一个非常好的和简单的解释。

另一篇可能很有趣的论文是使用有效样本大小进行分子模拟的自动采样评估张、巴特和祖克曼。在本文中,他们通过根据物理状态总体的方差估计的有效样本大小 (ESS) 来评估采样质量和收敛性。他们认为,州人口是最关键的慢观测值,因此是估计相关时间的一个很好的观测值。但他们也将基本问题置于一种免责声明中,表示他们回答了以下问题:“基于给定模拟中访问的配置状态的抽样统计质量是什么?” 他们当然知道,“如果没有关于景观的先验知识或假设,似乎不可能知道在给定的模拟中是否已经访问了每个重要状态。”