95% 置信区间内的所有值是否均等?

机器算法验证 置信区间
2022-01-31 05:25:54

我在以下问题上发现了不一致的信息:“如果构建均值差异或比例差异的 95% 置信区间 (CI),那么 CI 内的所有值是否同样可能?或者,点估计是最有可能的吗? , CI 的“尾部”附近的值比 CI 中间的值更不可能?

例如,如果随机临床试验报告指出特定治疗的相对死亡风险为 1.06(95% CI 0.96 至 1.18),那么 0.96 为正确值的可能性是否与 1.06 相同?

我在网上找到了很多关于这个概念的参考资料,但以下两个例子反映了其中的不确定性:

  1. Lisa Sullivan关于置信区间的模块指出:

    均值差的置信区间为 (μ1μ2)。值得注意的是,置信区间中的所有值都是对 (μ1μ2)。

  2. 这篇题为“误差范围内”的博文指出:

    我想到的是对“误差范围”的误解,它认为置信区间内的所有点都是同等可能的,就好像中心极限定理暗示了有界均匀分布而不是t分布。[...]
    谈到“误差范围”时遗漏的一点是,接近点估计的可能性比处于边缘边缘的可能性更有可能”。

这些似乎是矛盾的,那么哪个是正确的?

4个回答

需要回答的一个问题是,在这种情况下,“可能”是什么意思?

如果它表示概率(因为它有时用作同义词)并且我们使用严格的常客定义,那么真正的参数值是一个不变的值,所以那个点的概率(可能性)是 100% 并且所有其他值为 0%。所以几乎所有的概率都为 0%,但如果区间包含真值,那么它与其他区间不同。

如果我们使用贝叶斯方法,则 CI(可信区间)来自后验分布,您可以比较区间内不同点的似然性。除非后验在区间内完全一致(我猜理论上可能,但这将是一个奇怪的情况),否则这些值具有不同的可能性。

如果我们使用可能类似于置信度,那么可以这样考虑:计算 95% 置信区间、90% 置信区间和 85% 置信区间。我们有 5% 的把握认为真实值位于 95% 区间内但在 90% 区间之外的区域,我们可以说真实值有 5% 的可能性落在该区域内。对于 90% 区间内但 85% 区间外的区域也是如此。因此,如果每个值的可能性相同,则上述 2 个区域的大小需要完全相同,并且对于 10% 置信区间内但 5% 置信区间外的区域也是如此。构造区间所使用的标准分布都没有此属性(除了从制服中抽取 1 次的特殊情况)。

您可以通过模拟来自已知人群的大量数据集,计算感兴趣的置信区间,然后比较真实参数与点估计值比与每个端点更接近的频率来进一步证明这一点。

这是一个很好的问题!有一个称为可能性的数学概念可以帮助您理解这些问题。费舍尔发明了似然性,但认为它不如概率可取,但结果证明似然比概率更“原始”,Ian Hacking (1965) 认为它是公理的,因为它是不可证明的。可能性支持概率,而不是相反。

哈金,1965 年。统计推断的逻辑

没有充分的理由没有对可能性给予标准统计教科书应有的关注。它与概率的不同之处在于几乎完全具有人们所期望的属性,并且似然函数和区间对于推理非常有用。也许一些统计学家不喜欢可能性,因为有时没有“正确”的方法来推导相关的可能性函数。然而,在许多情况下,似然函数是显而易见的且定义明确的。对推理可能性的研究可能应该从 Richard Royall 的一本小而易懂的书开始,名为Statistical Evidence: a Likelihood Paradigm

您的问题的答案是不,任何区间内的点并不都有相同的可能性。置信区间边缘的那些人通常比接近区间中心的其他人具有更低的可能性。当然,传统的置信区间不会直接告诉您与特定实验相关的参数。Neyman 的置信区间是“全局的”,因为它们被设计为具有长期属性,而不是与手头实验相关的“局部”属性。(令人高兴的是,可以在本地解释良好的长期性能,但这是一种智力捷径,而不是数学现实。)可能性区间——在可以构建的情况下——直接反映与手头实验相关的可能性。

假设有人告诉我,我应该同等信任CI95 中的所有值作为人口价值的潜在指标。(我故意避免使用“可能”和“可能”这两个词。)95 有什么特别之处?没什么:为了保持一致,我还必须对 CI96、CI97 ……和 CI99.9999999 中的所有值给予同等信任。随着 CI 的覆盖范围接近其极限,几乎所有实数都必须包括在内。这个结论的荒谬性将导致我拒绝最初的主张。

让我们从置信区间的定义开始。如果我说 95% 的置信区间从这个到那个,我的意思是那种性质的陈述大约 95% 的时间是正确的,大约 5% 的时间是错误的。并不一定意味着我对这个特定的陈述有 95% 的信心。90% 的置信区间会更窄,80% 的置信区间会更窄。因此,当想知道真正的价值是什么时,我对这些价值的信任度越来越低,因为它们越来越接近任何特定置信区间的边缘。

请注意,以上所有内容都是定性的,尤其是“可信度”。(我在该声明中避免使用“信心”或“可能性”一词,因为它们带有可能与我们的直觉包袱不同的数学包袱。)贝叶斯方法会将您的问题重新表述为具有定量答案但我不想打开的问题那罐虫子在这里。

Box, Hunter & Hunter 的经典著作(“Statistics for Experimenters”,Wiley,1978)也可能有所帮助。请参阅第 113 页上的“置信区间集”,ff。