这通常是不正确的。我将提供一个简单的例子。
对二项式比例的流行检验源自中心极限定理。如果是结果的真实风险,那么渐近地,π
p≈dN[π,π(1−π)/n]
其中是我们的估计风险,是我们的样本量。然后通过使用方差中的估计风险(Wald 检验)或空值下的风险(Score 检验)对该分布进行标准化,从而找到该检验。检验统计量为pnp
Z=p−π0p(1−p)n−−−−−√
和相关的置信区间是
(πˆL,πˆU)=p±Z1−α/2p(1−p)/n−−−−−−−−−√
您在项目符号中的点对于此测试和相关的置信区间是正确的,因为后者是从前者派生的。但是,它们通常会失败,因为二项式存在许多不同的置信区间,所有这些区间都接近标称覆盖范围且宽度略有不同。可能是这样的情况,如上所示的比例检验产生的 p 值小到足以拒绝空值,但我发布的置信区间以外的置信区间覆盖了空值。1.
我们可以用一些 R 代码来证明这一点。我将使用 Wilson 得分区间和渐近区间计算范围和结果的置信区间。您会看到它们并没有完全对齐,这意味着一些间隔覆盖了一些值,而另一些则没有,即使考虑到使用相同的数据来创建两者。因此,可以说使用一些间隔我们会拒绝 null,而使用其他间隔会导致拒绝 null 失败。
library(binom)
n = 20
x = seq(0, n, 2)
a = binom.wilson(x, n)
b = binom.asymp(x, n)
plot(a$upper, b$upper, xlab = "Wilson Upper Limit", ylab='Asymptotic Upper Limit', type = 'l', col='red')
abline(0, 1)
参考
- Brown、Lawrence D.、T. Tony Cai 和 Anirban DasGupta。二项式比例和渐近展开的置信区间。统计年鉴30.1 (2002): 160-201。