是否有大规模的 MCMC 方法研究比较了几种不同算法在一组测试密度上的性能?我正在考虑与Rios 和 Sahinidis 的论文(2013 年)等效的东西,它是对几类测试函数上大量无导数黑盒优化器的彻底比较。
对于 MCMC,性能可以用例如每个密度评估的有效样本数 (ESS) 或一些其他适当的度量来估计。
几点评论:
我很欣赏性能将在很大程度上取决于目标 pdf 的细节,但类似(可能不相同)的论点适用于优化,尽管如此,仍有大量的基准函数、套件、竞赛、论文等处理基准优化算法。
此外,确实 MCMC 与优化的不同之处在于,用户需要更多的关注和调整。尽管如此,现在有几种 MCMC 方法需要很少或不需要调整:适应老化阶段、采样期间的方法,或进化多个交互链并使用的多状态(也称为ensemble)方法(例如Emcee )来自其他链的信息来指导抽样。
我对标准和多状态(又名集成)方法之间的比较特别感兴趣。关于多态的定义,见麦凯的书第 30.6 节:
在多状态方法中,维护它们在 Metropolis 和 Gibbs 等动作下单独进化;向量之间也存在相互作用。
- 这个问题源于这里。