在贝叶斯数据分析,第 13 章,第 317 页,第二个完整段落中,在模态和分布近似中,Gelman 等人。写:
如果计划是通过 [双变量正态分布中的相关参数] 的后验模式来总结推理,我们将用 ,相当于转换后的参数上的 Beta(2,2) 。先验密度和结果密度在边界处为零,因此后验模式永远不会是 -1 或 1。但是,...的先验密度在边界附近是线性的,因此不会与任何可能性相矛盾。
下面是 Beta(2,2) 分布的 PDF 图。
尽管该图是针对域 [0,1] 给出的,但对于通过执行上述引用中描述的变换的逆变换获得的域 [-1,1] 的形状是相同的。这是一个相当丰富的分布!它给的密度大约是的七倍。所以事实上,如果可能性指向远离边界的东西,但距离更远,它会与可能性相矛盾。Beta(1 + ,1 + ) 不是更好的边界,其中。以 Beta(1.0001, 1.0001) 为例,如下图所示:
当然,这个先验的问题在于密度在零附近急剧下降,这可能与它指向一个非常接近边界的空间的可能性相矛盾。这让我想到了我的问题:
为什么不直接将转换后的相关参数的先验设置为 Beta(1,1)?因为的 beta 分布密度为零,这相当于开区间 (-1,1) 上的均匀分布,而不是闭区间 [-1, 1],所以它不是一个避免先验的边界,并且它不是比先验更可取的的概率给予了相当强烈的信念,这只有在你确实有这种信念的情况下才是可取的?
更一般地说,根据定义使用 beta 分布不是避免先验的边界,因为它的支持是吗?