为什么不使用 Beta(1,1) 作为边界来避免转换相关参数的先验?

机器算法验证 贝叶斯 事先的 后部 模式
2022-03-16 14:29:40

贝叶斯数据分析,第 13 章,第 317 页,第二个完整段落中,在模态和分布近似中,Gelman 等人。写:

如果计划是通过 [双变量正态分布中的相关参数] 的后验模式来总结推理,我们将用 ,相当于转换后的参数上的 Beta(2,2) 。先验密度和结果密度在边界处为零,因此后验模式永远不会是 -1 或 1。但是,...的先验密度在边界附近是线性的,因此不会与任何可能性相矛盾。ρp(ρ)(1ρ)(1+ρ)ρ+12ρ

下面是 Beta(2,2) 分布的 PDF 图。

Beta(2,2) 的 PDF 图

尽管该图是针对域 [0,1] 给出的,但对于通过执行上述引用中描述的变换的逆变换获得的域 [-1,1] 的形状是相同的。这是一个相当丰富的分布!它给的密度大约是的七倍。所以事实上,如果可能性指向远离边界的东西,但距离更远,它会与可能性相矛盾。Beta(1 + ,1 + ) 不是更好的边界,其中以 Beta(1.0001, 1.0001) 为例,如下图所示:ρ+12=0.5ρ+12=0.3,0.97ρ=0δδδ0

Beta(1.0001,1.0001) 的 PDF 图

当然,这个先验的问题在于密度在零附近急剧下降,这可能与它指向一个非常接近边界的空间的可能性相矛盾。这让我想到了我的问题:

为什么不直接将转换后的相关参数的先验设置为 Beta(1,1)?因为的 beta 分布密度为零,这相当于区间 (-1,1) 上的均匀分布,而不是闭区间 [-1, 1],所以它不是一个避免先验的边界,并且它不是比先验更可取的的概率给予了相当强烈的信念,这只有在你确实有这种信念的情况下才是可取的?ρ+12=0,1ρ=0

更一般地说,根据定义使用 beta 分布不是避免先验的边界,因为它的支持是吗?0<ρ+12<1

1个回答

在似然函数在处最大化的情况下,在开区间上使用 Beta(1,1) 并没有帮助,因为那时没有明确定义的后验模式。在开区间中没有一点可以说是后验模式。 ρ=1

本书希望先验在边界处是线性的,从而从所有 Beta 分布中唯一地选择 Beta(2,2)。但这本书从未准确解释线性度为何如此重要。