我一直在详细阅读 Radford Neal 出色的 HMC 书籍章节。但是,有一个细节我现在真的很着迷,我不确定我是否考虑对了。在描述计算机实现所需的 HMC 的 Metropolis 步骤时,他说:
轨迹末端动量变量的否定使 Metropolis 提议对称,因为上述接受概率有效
但是,我无法弄清楚为什么否定动量变量意味着提案是对称的。为了清楚起见,这是我对事物的理解:
- 定义一个提案,它表示从状态开始,然后将作为提案的密度,然后我们使用 MH 检查是否接受。
- 在许多情况下,我们希望提案是对称的,因此 MH 测试简化为 Metropolis 测试。一种方法是使用高斯建议,因此将定义为从具有固定方差的高斯采样,以为中心。那么因为高斯是对称的,所以。
- 使用 HMC,我们从开始时有以下步骤:(1) 采样动量变量,通常是高斯变量,(2) 运行步来更新这两个变量,(3) 最后将动量变量取反为得到我们最终提出的状态。在这里,我使用 Radford Neal 关于系统状态的符号,其中表示位置,表示动量。
好的,所以现在我需要知道为什么提案是对称的。我想我需要了解以下几点:
- 我认为在采样动量变量之后,越级步骤是“确定性的” (除非我们在计算导数时注入随机性)。这是否意味着从给定状态开始然后简单地应用跳跃步骤(假设没有对动量变量进行采样)直到我们到达稍后的状态的概率是一个?所以这是一个增量分布,真的。
- 但是当我们对这些高斯动量变量进行采样时会发生什么。它们不会影响提案概率吗?当你包括越级步骤时,我不知道如何分析这一点。
- Neal 还讨论了可逆性、哈密顿量守恒和哈密顿动力学的体积保持。我想我需要更好地理解可逆性和体积保持意味着我们可以声称该提案是对称的。(我认为哈密顿量的守恒用于表明理论上应该具有相同的值,但在计算机实现中却没有。)不幸的是,我似乎在这里遇到了障碍。
谢谢你的时间!