如何正确用词频繁置信区间

机器算法验证 置信区间 可信区间
2022-01-29 01:05:33

我知道这有很多很多线程(例如这个优秀的线程)。我可能错过了它,但我似乎找不到一个真正解释如何使用区间中包含的实际数字准确报告常客置信度的文章。

所以说我有一个回归系数β=3.4CI=[0.5,5.6]

贝叶斯可信区间

如果 CI 是贝叶斯可信区间,则报告此区间非常简单:

“鉴于模型的数据和假设,的真实值有 95% 的概率介于 0.5 和 5.6 之间”β

频率论置信区间

现在我们知道,当区间是置信区间时,正确地报告它更加棘手。根据我读过的内容,我会冒险

“如果我们进行许多实验,所构建的 95% 区间中的 95% 将包含的真实值”β

令我困惑的是,CI 中的实际数字并未出现在此解释中。

在忠实于频率论的概率观点的同时,我如何将平均值或 CI 用于我的效果报告?

4个回答

您可以通过多种方式合理地表述置信区间陈述,但以下陈述的任何变化都可以。(由于您没有相反地指定,我假设这是一个 95% 的置信区间。如果不是,那么您应该在陈述中进行适当的更改。)重要的是您清楚地给出您的置信水平和区间出于兴趣。您还应该确保正确区分估计符号和真实参数值的符号。

  • 我们对斜率的估计是 ( )。β^=3.495%CI=[0.5,5.6]

  • 在 95% 的置信度下,我们推断真正的斜率值在区间内。0.5β5.6

  • 以 95% 的置信度,我们发现0.5β5.6

“置信度”的概念在经典统计中具有明确且众所周知的含义,因此,如果您指的是对某个参数落在某个区间内具有一定的置信水平,那么这将自动被理解为报告置信区间。您无需担心是否忠实于特定框架 --- 实践中使用的概率论框架只有一个,置信区间只有一个含义。实际上,当其他框架在(例如,贝叶斯推理中的“可信区间”)中提出类似的想法时,它们会确保准确地使用不同的术语以避免在这个主题上产生混淆。

如果您只是在做应用统计工作,则无需指定“信心”的确切统计含义。对于大多数读者来说,它是微妙而令人困惑的,如果他们感兴趣,你可以合理地让他们有责任阅读它。许多在任何领域具有应用科学背景的人都会参加一些介绍性统计课程,他们在那里学习然后忘记了置信区间的含义。大多数读者只会对统计专业对这一概念给予认可这一事实感到满意。对于统计专家来说,他们会知道这个概念的确切含义,并且对您的总结报告同样满意。

担心“概率”的正确解释是从中删除的另一个顺序,这当然不是您在报告数据统计分析时需要关心的事情。感兴趣的读者如果真的愿意,可以深入哲学的兔子洞和概率论的基础。


学术文献中偶尔有论文检查“概率”的非标准版本(例如,使用复数等),但这些基本上都是废话。

我同意 Ben 的观点,通常情况下,您只会说,“我们对斜率的估计是。”β^=3.4 (95% CI=[0.5,5.6])

如果您真的需要向某人解释置信区间是什么,我可能不会使用您的公式,“如果我们进行许多实验,构建的 95% 区间中有 95% 将包含的真实值。” 我在教书时确实会这么说(尽管我会用额外的解释和活动来补充),但我从不对客户说。这不是一个适用于许多人的声明。β

老实说,我发现我需要为置信区间提供定义并不常见。如果我这样做了,我所说的是其中一个版本:

如果我们的零假设是此区间内的任何值,我们将无法排除它。

或相反:

如果我们的零假设是这个区间之外的任何值,我们可以排除它。

如果信息,这篇文章是这样一个金矿。它本身就值得一读。

置信区间解释是精度-有用性权衡中的一种实践:您可以准确地说明置信区间是什么,它不会有用。随着您放松精度,它变得越来越有用。但是,这种精度损失是一种成本,您对置信区间的解释越有用,就会有越多的人不同意您(由于精度损失)。

解释置信区间的一种流行方法如下(根据链接的帖子):

相容性区间表明了广泛的合理真实治疗效果。

或者换句话说,“区间内的那些参数表示参数的合理真实值”。我对这种解释并不完全赞同。这里“真”取决于所选的视为对应于真相并不令人信服。考虑到这一点,也许一个好的修订是αα=0.05

根据我们允许的假阳性率,相容性区间表明了一系列合理的真实治疗效果。

如果这是我学到的关于统计数据的一件事,那就是人们仍然不同意对置信区间的解释。为了避免(一次又一次地)进入关于这个的对话,我只是说

置信区间总结了与数据一致的参数空间区域

我发现这种解释是有用性和精确性的充分平衡。

怎么样:

“一个从实验构造区间的程序,具有由该程序构造的区间在 95% 的情况下包含 β 的真实值的性质应用于该实验,其中。程序构造的区间是βββ^=3.4[0.5,5.6]