参考此线程:您如何向外行解释马尔可夫链蒙特卡罗(MCMC)?.
我可以看到它是马尔可夫链和蒙特卡洛的组合:马尔可夫链是用后验作为不变限制分布创建的,然后蒙特卡洛绘制(依赖)是从限制分布(=我们的后验)。
假设(我知道我在这里简化)在步之后,我们处于极限分布 (*)。
马尔可夫链是一个随机变量序列,我得到一个序列,其中是随机变量,是限制 '我们希望从中采样的“随机变量”。
MCMC 从一个初始值开始,即是一个随机变量,所有质量都在那个值处。如果我对随机变量使用大写字母,对随机变量的实现使用小写字母,那么 MCMC 会给我一个序列 . 所以MCMC链的长度是L+n。
[[*注意:大写字母是随机变量(即一大堆结果),小是结果,即一个特定值。* ]]
显然,只有属于我的“后验”,并且为了近似后验“好”,的值应该“足够大”。
如果我总结一下,那么我有一个长度为,只有与我的后验近似相关,并且应该足够大。
如果我在计算后验近似值时确实包含了一些(即在达到不变分布之前的实现),那么它将是“嘈杂的”。
我知道 MCMC 链的长度,但不知道,即我确定从限制分布中采样的步骤,我不能确定我没有包括噪声,我也不能确定,我的样本来自极限分布的大小,特别是,我不能确定它是否“足够大”。
因此,据我了解,的这个值对于后验的近似质量(排除噪声和大样本)至关重要。
当我申请 MCMC 时,有什么方法可以找到
(*) 我认为,一般来说,将取决于初始值。