什么时候(和不)置信区间和可信区间重合?

机器算法验证 置信区间 可信区间
2022-04-07 07:27:46

是的,我知道在比较这两种类型的区间时有很多问题,但似乎没有一个能够回答这个确切的问题。

这是一篇博客文章,展示了两种间隔相同和不同的一种情况:

https://jakevdp.github.io/blog/2014/06/12/frequentism-and-bayesianism-3-confidence-credibility/

但这有什么一般规则吗?我个人的经验表明,将置信区间误解为可信区间很普遍(我猜医学文献中几乎 100% 被误解了)。但是,只要置信区间非常接近可信区间,这在实践中似乎没有问题。

1个回答

我不确定您是否可以认为这是一个完整的答案,因此您可以仔细检查自己,但是,就这样。

根据置信区间的定义,

在计算置信区间 (CI)时,将落在计算的 CI 内,X%X%y

然后您可以合成一个您知道真实参数值的实验,然后模拟噪声(基于假设的似然函数)假设次。当您进行拟合并计算置信区间时,应该在的时间范围内。如果这在很大程度上失败或成功,那么它会影响决策。yP=1000X%yX%

另一方面,给定可信区间的定义,其中

给定观察到的数据,落在可信区间内的概率X%yX%

代表着

  • 您必须综合个不同的参数(这是您的真实值),P{yp}p=1,,P
  • 使用贝叶斯估计次求解,P
  • 计算每个 (次)X%P
  • 并期望真值应落在可信区间内。X%yp

注: 上述场景中PX

总而言之,为了能够公平地比较可信区间和置信区间,您需要遵循它们的定义。在频率论方法中,您假设一组固定的参数(记住频率论者假设参数是固定的)并模拟测量(数据)中的噪声,而在贝叶斯方法中,您假设您的数据是固定的,因此您必须“随机化”参数。如果您遵循这种方法,则可以公平地比较可信区间和置信区间(无论先验分布如何)。