我正在阅读 Geyer 1991 年的会议论文,链接如下。在其中,他似乎逃避了一种可以使用 MCMC 进行 MLE 参数估计的方法
这让我很兴奋,因为我已经编写了 BFGS 算法、GA 和各种这些可怕的手摇幸运倾角方法,这些方法可以找到从 MLE 中提取参数估计所需的全局最小值。
它让我兴奋的原因是,如果我们能够保证 MCMC 收敛到一个固定点(例如,一个充分的标准将满足详细的平衡),那么我们可以在不最小化 MLE 的情况下获得参数。
因此,结论是,这提供了一种通用方法来获得上面和本文中施加的全局最小值、模约束。MCMC 有许多算法,例如 HMC,它们可以很好地映射到高维 MCMC 问题,我认为它们会优于传统的梯度下降方法。
问题
这篇论文为使用 MCMC 从 MLE 获取参数估计提供了理论基础,我是否正确?
如本文所述,是否可以在某些情况下使用 MCMC 算法从 MLE 中提取参数,从而绕过对遗传算法和 BFGS 等方法的需求。
纸
盖尔,CJ (1991)。马尔可夫链蒙特卡罗最大似然。计算科学与统计:PROC。第 23 次症状。接口,156-163。
抽象的
马尔可夫链蒙特卡罗(例如,Metropolis 算法和 Gibbs 采样器)是一种通用工具,用于模拟在许多类型的统计推断中有用的复杂随机过程。回顾了马尔可夫链蒙特卡罗的基础知识,包括算法选择和方差估计,并介绍了一些新方法。解释了使用马尔可夫链蒙特卡罗进行最大似然估计,并将其性能与最大伪似然估计进行了比较。
注意:第 1-6 节很无聊,如果你走到这一步,你可能已经知道它们了。在第 7 节中,他谈到了有趣但他称之为“蒙特卡洛最大似然”的东西
更多资源
control+f 表示“Geyer”