Winbugs 和其他 MCMC 没有事先分发的信息

机器算法验证 r 贝叶斯 马尔可夫链蒙特卡罗 错误 虫虫
2022-03-30 07:53:05

当您不了解参数分布时会发生什么?我们应该使用什么方法?

大多数时候,我们的目标是了解某个变量是否对某个物种的存在/不存在有任何影响,以及该变量是否被接受取决于变量的重要性。这意味着大多数时候我们没有考虑参数应该具有的预期分布。

假设所有参数都遵循正态分布是否正确,而我只知道 b1、b2、b3 和 b4 应该在 -2 和 2 之间变化,而 b0 可以在 -5 和 5 之间变化?

model {
    # N observations
    for (i in 1:N) {
        species[i] ~ dbern(p[i])
        logit(p[i]) <- b0 + b1*var1[i] + b2*var2[i] + 
            b3*var3[i] + b4*var4[i]
    }
    # Priors
    b0     ~ dnorm(0,10)
    b1   ~ dnorm(0,10)
    b2 ~ dnorm(0,10)
    b3  ~ dnorm(0,10)
    b4  ~ dnorm(0,10)
}
3个回答

不幸的是,看似无害的先验可能非常危险(甚至愚弄了一些经验丰富的贝叶斯主义者)。

这篇最近的论文提供了一个很好的介绍以及绘图方法来可视化先验和后验(通常是感兴趣参数的边际先验/后验)。

指定非信息性先验的隐藏危险。John W. Seaman III、John W. Seaman Jr. 和 James D. Stamey 美国统计学家第 66 卷,第 2 期,2012 年 5 月,第 77-84 页。 http://amstat.tandfonline.com/doi/full/10.1080/00031305.2012.695938

在我看来,这些图在任何实际的贝叶斯分析中都应该是强制性的,即使分析师不需要它们——对于大多数读者来说,贝叶斯分析中发生的事情应该是清楚的。

线性预测器中的参数是 t 分布的当记录数达到无穷大时,它会收敛到正态分布。所以是的,通常假设参数的正态分布被认为是正确的。

无论如何,在贝叶斯统计中,您无需假设参数分布。通常,您指定所谓的无信息先验对于每种情况,建议使用不同的无信息先验。在这种情况下,人们经常使用类似的东西(当然你可以调整值):

dunif(-100000, 100000)

或者

dnorm(0, 1/10^10)

第二个是优选的,因为它不限于特定值。有了没有信息的先验,你就没有风险。您当然可以将它们限制在特定的时间间隔内,但要小心。

所以,你指定无信息的先验,参数分布就会自己出来!无需对此做任何假设。

敏感性分析通常是一个很好的方法:尝试不同的先验,看看你的结果如何随它们变化。如果它们很可靠,您可能能够让很多人相信您的结果。否则,您可能希望以某种方式量化先验如何改变结果。