我正在尝试使用非对角质量矩阵来实现 HMC,但我被一些术语绊倒了。
根据 BDA3 和 Neal 的评论,动能项(我猜为了方便总是使用它)是
这也是可识别的,称为具有零均值和协方差矩阵的多元正态. BDA3 (pg 301) 说
为简单起见,我们通常使用对角质量矩阵 M。如果是这样,则 φ 的分量是独立的,对于每个维度 j = 1,都有 φj ∼ N(0,Mjj)。. . ,d。对 M 使用后验分布的逆协方差矩阵 (var(θ|y))^-1 进行粗略缩放可能很有用。
(我正在阅读 N(0, M)) 作为均值为零和协方差 M 的多元正态。)
让我绊倒的部分是说“它可能对用后验分布的逆协方差矩阵粗略缩放......”。
然后也是在此之前开始越级步骤的动量样本() 是从具有协方差矩阵的多元法线绘制的.
那么它是哪一个?要为 HMC 构造一个好的 M,我应该估计后验的协方差还是精度矩阵?虽然是动能的协方差矩阵,使用那是对后验精度矩阵的估计会产生更有效的算法吗?
第二个问题:可以指导我的直觉是什么?
您是否想使用精确矩阵以使动量与势能/后验正交推动以改善混合?
或者您是否希望动量推向后验的高概率质量部分(因为那是您想要从中提取大多数样本的地方)。
ps 我不使用单位矩阵的原因是因为对于我的问题,我碰巧能够事先获得对我相当高维(~1000)后验的协方差矩阵的不错估计。