置信区间的解释

机器算法验证 可能性 置信区间
2022-02-12 23:23:28

注意:如果这是重复的,请提前道歉,我在搜索中没有找到类似的 q

假设我们有一个真正的参数 p。置信区间 C(X) 是一个包含 p 的 RV,比如 95% 的时间。现在假设我们观察 X 并计算 C(X)。常见的答案似乎是,将其解释为“有 95% 的机会包含 p”是不正确的,因为它“要么包含 p,要么不包含 p”

但是,假设我从洗好的牌组顶部挑选一张牌,并将其面朝下放置。直觉上,我认为这张牌成为黑桃 A 的概率为 1/52,尽管实际上“它要么是黑桃 A,要么不是黑桃 A”。为什么我不能将此推理应用于置信区间的示例?

或者,如果谈论这张牌是黑桃 A 的“概率”没有意义,因为它“是或不是”,我仍然会以 51:1 的赔率说它不是黑桃 A。有没有其他词来描述这些信息?这个概念与“概率”有何不同?

编辑:也许更清楚一点,从概率的贝叶斯解释来看,如果我被告知随机变量在 95% 的情况下包含 p,考虑到该随机变量的实现(并且没有其他信息可以作为条件)是正确地说随机变量有 95% 的概率包含 p?

编辑:另外,从概率的常客解释来看,假设常客同意不说“置信区间包含 p 的概率为 95%”。常客对置信区间包含 p 有“信心”是否仍然合乎逻辑?

令 alpha 为显着性水平,令 t = 100-alpha。K(t) 是常客对置信区间包含 p 的“置信度”。有意义的是,K(t) 应该在 t 中增加。当 t = 100% 时,常客应该确定(根据定义)置信区间包含 p,因此我们可以标准化 K(1) = 1。类似地,K(0) = 0。大概 K(0.95) 介于0 和 1 和 K(0.999999) 更大。常客会以何种方式认为 K 不同于 P(概率分布)?

2个回答

我认为很多关于这个问题的传统说法都不清楚。

假设你取一个大小的样本100并得到一个95%置信区间p.

然后你再取一个样本100,独立于第一个,得到另一个95%置信区间p.

变化的是置信区间;不变的是p. 这意味着在频率论方法中,有人说置信区间是“随机的”,但p是“固定的”或“恒定的”,即不是随机的。在频率论方法中,例如置信区间方法,人们只将概率分配给随机的事物。

所以Pr(L<p<U)=0.95置信区间。 “lower”和 “upper”。)取一个新样本,改变,但没有。(L,U)L=U=LUp

假设在特定情况下您有的概率之外,分配概率,因为这里没有任何东西是随机的:不是随机的,不是随机的(因为它不会改变,如果我们取一个新样本),并且不是随机的。L=40.53U=43.6140.53<p<43.610140.53p43.61

在实践中,人们确实表现得好像他们确定介于之间。作为一个实际问题,这通常是有道理的。但有时它不会。一种这样的情况是,如果预先知道大到或更大的数字是不可能的,或者如果知道它们很可能。如果可以为分配一些先验概率分布,则可以使用贝叶斯定理得到一个可信区间,该区间可能与置信区间不同,因为先验知道95%p40.5343.6140pp是可能的或不可能的。实际上也可能发生这样的情况:数据本身——如果采集新样本会发生变化,可以告诉你不太可能,甚至肯定不会像一样大。的充分统计量的情况下,也会发生这种情况在某些情况下,这种现象可以通过费雪基于辅助统计的条件方法来处理。最后一种现象的一个例子是当样本仅包含两个独立的观察值,这些观察值均匀分布在区间中。那么从两个观察值中的较小者到较大者的区间是p40(L,U)pθ±1/250%置信区间。但是如果它们之间的距离是,那么接近肯定在它们之间是荒谬的,如果距离是,那么合理地几乎肯定在它们之间。它们之间的距离将是一个可以作为条件的辅助统计数据。0.00150%θ0.999100%θ

% 置信区间的教科书定义是:100×(1α)

一个区间,在理想条件下的研究的许多独立复制下, % 的时间捕获了复制效应测量。100×(1α)

对于常客来说,概率来自“倒带时间和空间”的概念来复制发现,就好像创造了无限数量的世界副本来一次又一次地评估科学发现。所以概率就是一个频率。对于科学家来说,这是讨论研究结果的一种非常方便的方式,因为科学的首要原则是研究必须具有可复制性。

在您的卡片示例中,贝叶斯和常客的困惑在于常客不会为您从牌堆中翻转的特定卡片的面值分配概率,而贝叶斯会。常客将概率分配给一张卡片,从随机洗牌的牌堆顶部翻转。贝叶斯不关心复制研究,一旦卡片被翻转,你现在对卡片是什么有 100% 的信念,而对它可以取任何其他值的信念是 0%。对于贝叶斯主义者来说,概率是对信念的衡量。

请注意,由于这个原因,贝叶斯没有置信区间,它们用可信区间总结了不确定性。