我应该报告可信区间而不是置信区间吗?

机器算法验证 置信区间 方法 可信区间
2022-03-09 04:21:56

在一本统计学教科书中偶然发现了这个概念之后,我试图把它包起来,最后得出了一个似乎符合我迄今为止所看到的所有解释的结论:可信区间是非统计学家认为的置信度间隔是。


对于像我这样一小时前不知道区别的人来说,题外话

如果我们观察数据并从中预测一些参数,假设是平均值μ,可信区间是区间[μmin, μmax]为此,我们有 95% 的把握 mu 落入其中(或者,如果我们使用另一个级别,则为 95% 以外的某个数字)。统计学入门课程中教授的置信区间可以与可信区间重叠,但并不总是很好地重叠。如果您想勇敢地解释,请尝试在 Cross Validated 上阅读这个这个问题;经过一番摸索,最终帮助我理解的是这个答案


这是否意味着在我的结果中使用可信区间而不是置信区间在科学上更可取?如果是,为什么我没有看到任何使用它的出版物?

  • 是因为应该使用概念,但测量科学家还没有赶上正确的统计方法吗?
  • 还是原始置信区间的含义更适合解释实证研究的结果?
  • 还是在实践中,它们经常重叠以至于根本不重要?
  • 选择是否取决于我们为数据假设的统计分布?也许对于高斯分布,它们总是在数字上重叠,所以除了纯统计之外没有人关心差异(我读过的许多研究甚至都懒得计算任何类型的区间,也许大约 1% 曾经给思考留出空间他们的数据可能不是正态分布的)。
  • 这取决于我们的科学理论地位吗?例如,感觉在实证主义工作中应该使用置信区间,在解释主义工作中应该使用可信区间,但我不确定这种感觉是否正确。
1个回答

间隔类型表示您使用的方法类型。如果是可信区间(或贝叶斯变体),则表示使用了贝叶斯方法。如果是置信区间,则使用频率论方法。

回复:还是在实践中,它们经常重叠以至于根本不重要?只要

  • 使用方法的条件得到合理满足(例如,“观察的独立性”是许多方法的要求),
  • 贝叶斯方法不使用信息先验,
  • 不是很小的样本,并且
  • 模型/方法是类似的,

可信区间和置信区间将彼此接近。原因:可能性将主导贝叶斯先验,而可能性是频率论方法中通常使用的。

我建议不要担心使用哪个。如果你想要一个信息丰富的先验,那么一定要使用贝叶斯方法。如果不是,那么选择一个合适的方法和上下文(frequentist 或 Bayesian),检查以确保应用该方法所需的条件得到合理满足(非常重要但很少这样做!),然后如果该方法适用于数据的类型。