当对平均方差感兴趣时,可以/应该将哪些先验分布用于分层贝叶斯模型中的方差?

机器算法验证 贝叶斯 方差 事先的 锯齿 分层贝叶斯
2022-01-17 13:09:33

在他被广泛引用的论文中,层次模型中方差参数的先验分布 (迄今为止在 Google Scholar 上引用了 916 次)Gelman 提出,分层贝叶斯模型中方差的良好非信息性先验分布是均匀分布和半 t 分布。如果我理解正确,那么当主要关注位置参数(例如平均值)时,它会很好地工作。然而,有时方差参数是主要关注点,例如在分析来自计时任务的人类响应数据时,意味着计时可变性通常是感兴趣的度量。在这些情况下,我不清楚如何使用例如均匀分布对可变性进行分层建模,因为我在分析后希望在参与者级别和组级别上获得均值方差的可信度。

那么我的问题是:当主要关注数据的方差时,在构建分层贝叶斯模型时推荐什么分布?

我知道可以将伽马分布重新参数化为由均值和 SD 指定。例如,下面的层次模型来自 Kruschke 的《做贝叶斯数据分析》一书。但是 Gelman 在他的文章中概述了 gamma 分布的一些问题,我将不胜感激替代方案的建议,最好是在 BUGS/JAGS 中不难工作的替代方案。

在此处输入图像描述

2个回答

我不同意您解释 Gelman 关于选择 Gamma 作为比例参数的方式。分层建模的基础是通过具有未知(通常是均值和方差)参数的结构将单个参数与公共参数相关联。从这个意义上说,对个体方差(或对重尾的对数正态)使用以均值方差为条件的伽马分布及其分散对我来说似乎是有效的(至少就 Gelman 论点而言)。

Gelman 关于尺度参数 gamma 的批评者是关于 gamma 用于通过为其参数设置极值来逼近 Jeffreys 的事实。问题在于,根据这些值的极端程度(这是非常随意的),后验可能会非常不同。这个观察使这个先验的使用无效,至少当我们没有信息可以在先验中设置时。在讨论中,在我看来,伽玛或逆伽玛从未根据先验信息或层次结构的均值和方差进行校准。因此,它的建议涉及与您的完全不同的背景,如果我很好地理解您的目的,

很快,Gelman 概述了使用 Gamma 分布作为方差的模糊(他使用单词noninformative)先验的问题。相反,您的问题(以及 Kruschke 的示例)似乎是指存在一些关于方差的知识的情况。还要注意方差分布的图片τi一点也不平坦。