动机:我站在一个班级前,使用均值差异的例子(纯粹的常客设置)来介绍置信区间的概念,我用这种不方便的置信区间解释来折磨学生。过了一会儿,一个学生问:“在讲座开始时,您告诉我们置信区间比纯 p 值更有用,因为 p 值很难解释,并且与许多人认为的含义不同。做——但你的置信区间似乎也有同样的缺点”。我立刻想,“好吧,他有一个正确的观点。我们去贝叶斯吧!”,但这肯定会超出课程的限制。
引用 AdamO 在置信区间解释中的回答:
% 置信区间的教科书定义是:
一个区间,在理想条件下的研究的许多独立复制下, % 的时间捕获了复制效应测量。
现在,当我们在贝叶斯框架中时,我们可以构建所谓的可信区间,它允许我们陈述如下结论:
[给定我们使用的先验分布] 对于 95% 的可信区间,感兴趣的值(例如治疗效果的大小)在该区间内的概率为 95%。(来源)
当然,对于没有受过频繁思维训练的人来说,可信区间的解释比置信区间的解释要直观得多。
我知道造成这种差异的一个重要原因是,在频率论框架中,我们不将参数视为随机变量,而是将其视为固定值,而置信区间本身是随机的。但是,在某些情况下,我们可以证明从两个框架计算的置信区间是一致的。这些“特定情况”特别涵盖了最常见的情况,即均值差和具有弱信息先验分布的线性回归的情况。
我的问题来了:如果我能证明贝叶斯可信区间和常客置信区间一致,为什么我不能以贝叶斯方式解释常客置信区间?