您如何使用马尔可夫链(蒙特卡洛)的绘图进行(贝叶斯)推理?

机器算法验证 贝叶斯 马尔可夫链蒙特卡罗
2022-03-24 07:40:50

假设是一个马尔可夫链,其状态空间为和转移概率 = = =(即,马尔可夫链是上的随机游走,有 1/3 的概率保持原位,1/3 的概率移动正负 1,末端有回绕。)极限分布是上的均匀分布X0,X1,...S={0,1,2,3,...,N1}P(Xn+1=a+1modN|Xn=a)P(Xn+1=amodN|Xn=a)P(Xn+1=a1modN|Xn=a)1/3Sπ=(1/N,1/N,...,1/N)S

据我了解,MCMC 的重点是创建马尔可夫链,使得平稳分布是您要从中采样的分布。所以上面的链可以用来从上的统一分布中采样(愚蠢的例子,但对我来说是裸露的)。据我了解,您从开始,“老化”进行了一些迭代,随后的迭代是从中提取的。Sx0Sπ

几个问题:

首先,您如何确定老化期的长度?即使对于上面的简单示例,平稳分布的时间似乎也高度依赖于链的“移动”程度(例如,如果 = .9 ,那么分散分布需要更长的时间)。 P(Xn+1=amodN|Xn=a)

老化后,draws之间的依赖关系起到什么作用?文献使我相信我可以在老化期之后使用抽奖作为从抽奖,但显然根据转换规则,个人抽奖仍然相互依赖......如果你使用太少的抽奖 '如上所述,保持静止的概率为 0.9,这根本不统一。π

这似乎意味着我对抽奖所做的任何计算(如近似期望)都必须对大于老化期的抽奖集进行,但要多出多少?

1个回答

贝叶斯统计不依赖于马尔可夫链(理论上很好),马尔可夫链蒙特卡罗是一种使贝叶斯统计中的计算更容易(可行)的方法。通常我们希望从后验分布中生成数据,我们可以轻松地计算其中的一部分,但并非总是全部(归一化系数通常是最难的部分),但是 McMC 方法会从后验中生成数据,而不需要知道一些更难找到的部分,这是 McMC 与贝叶斯统计数据的好处(尽管存在一些问题,即后验确切知道并且根本不需要 McMC)。后验是统一的是非常罕见的,所以你的例子不现实,但仍然可以帮助理解。

关于老化时间和链条运行时间的简短回答是“我们不知道”。更长一点(更有用)的答案是运行链一段时间,然后查看它是否看起来不错(是的,这是主观的,但经验会有所帮助,如果我们知道确切的答案,我们会知道的不够多需要 McMC),然后经常运行更长的时间来确定。我见过一些情况,该链运行了很多次迭代,看起来不错,但研究人员决定将其运行时间延长 4 倍,以确保它在接近尾声时突然跳到分布的不同部分之前没有被覆盖。

更多的依赖确实意味着链需要运行更长时间(老化和总运行),但只要链运行足够长,依赖就不再重要。考虑一个所有值独立的简单随机样本,现在将值排序为顺序统计,它们不再独立,但均值和 sd 相同,并且也可以估计总体。只要有足够的迭代来完全表示分布,McMC 迭代是依赖的这一事实并不重要。您的统一示例显示了运行时间过短的风险。