用贝叶斯术语解释置信区间

机器算法验证 贝叶斯 置信区间 常客 可信区间
2022-04-15 04:20:42

动机:我站在一个班级前,使用均值差异的例子(纯粹的常客设置)来介绍置信区间的概念,我用这种不方便的置信区间解释来折磨学生。过了一会儿,一个学生问:“在讲座开始时,您告诉我们置信区间比纯 p 值更有用,因为 p 值很难解释,并且与许多人认为的含义不同。做——但你的置信区间似乎也有同样的缺点”。我立刻想,“好吧,他有一个正确的观点。我们去贝叶斯吧!”,但这肯定会超出课程的限制。

引用 AdamO 在置信区间解释中的回答:

% 置信区间的教科书定义是:100×(1α)

一个区间,在理想条件下的研究的许多独立复制下, % 的时间捕获了复制效应测量。100×(1α)

现在,当我们在贝叶斯框架中时,我们可以构建所谓的可信区间,它允许我们陈述如下结论:

[给定我们使用的先验分布] 对于 95% 的可信区间,感兴趣的值(例如治疗效果的大小)在该区间内的概率为 95%。来源

当然,对于没有受过频繁思维训练的人来说,可信区间的解释比置信区间的解释要直观得多。

我知道造成这种差异的一个重要原因是,在频率论框架中,我们不将参数视为随机变量,而是将其视为固定值,而置信区间本身是随机的。但是,在某些情况下,我们可以证明从两个框架计算的置信区间是一致的。这些“特定情况”特别涵盖了最常见的情况,即均值差和具有弱信息先验分布的线性回归的情况。

我的问题来了:如果我能证明贝叶斯可信区间和常客置信区间一致,为什么我不能以贝叶斯方式解释常客置信区间?

1个回答

一个非数学的答案:

有很多过程会导致相同的答案,但具有完全不同的底层机制或操作。

一个简单的例子是将中位数与平均值进行比较。两者都依赖于不同的操作,并且都有完全不同的解释,但在很多情况下,答案是完全相同的。但是,这并不意味着您可以在明确报告均值时使用中位数的解释,反之亦然。

置信区间和可信区间也是如此。