在贝叶斯推理中,需要根据先验分布和数据的似然性来确定参数的后验分布。由于这种计算可能无法进行分析,因此可能需要模拟方法。
在 MCMC(马尔可夫链蒙特卡罗)算法中,会生成一条马尔可夫链,其极限分布是期望的后验分布。在实践中,可能很难评估是否已经实现了收敛。当您在有限步停止马尔可夫链时,您没有独立的实现,因为每个生成的点都依赖于前面的点。问题是,随着链条的推进,这种依赖会越来越低,在无穷远处,你会从后面获得独立的实现。
因此,让我们假设我们已经在有限步停止了马尔可夫链,并且获得的样本还具有显着的自相关性。我们没有来自后验分布的独立抽取。细化包括在每个步从样本中挑选分离的点。当我们从马尔可夫链中分离点时,依赖性变得更小,我们实现了某种独立样本。但是我对这个过程的不理解是,虽然我们有一个(大约)独立的样本,但我们还没有从后验分布进行模拟;否则整个样本将具有当前的独立性。
所以在我看来,细化提供了更多的独立性,这对于通过蒙特卡洛模拟和大数定律来近似统计数据肯定是必要的。但它不会加速与后验分布的相遇。至少,我不知道关于后一个事实的任何数学证据。所以,实际上,我们一无所获(除了更少的存储和内存需求)。对此问题的任何见解将不胜感激。