prop.test 返回的耶茨对置信区间的连续性校正

机器算法验证 r 置信区间 yates-校正
2022-03-14 18:30:25

这是 prop.test 估计的置信区间

n <- 600; x <- 276; p <- 0.40
prop.test(x, n, p, alternative="two.sided", conf.level=0.95, correct=T)
95 percent confidence interval:
 0.4196787 0.5008409 

我试图重现它,阅读 prop.test 下的代码。这是获得这两个限制的简化方法

ESTIMATE <- x/n
YATES <- 0.5
conf.level <- 0.95
z <- qnorm((1 + conf.level)/2)
YATES <- min(YATES, abs(x - n * p)) 
z22n <- z^2/(2 * n)
p.c <- ESTIMATE + YATES/n
(p.c + z22n + z * sqrt(p.c * (1 - p.c)/n + z22n/(2 * n)))/(1 + 2 * z22n)
[1] 0.5008409
p.c <- ESTIMATE - YATES/n
(p.c + z22n - z * sqrt(p.c * (1 - p.c)/n + z22n/(2 * n)))/(1 + 2 * z22n)
[1] 0.4196787

你能解释一下为什么在第 5 行中使用了潜在的成功概率 (p) 吗?或者您可以建议我在哪里可以找到有关影响 ESTIMATE 的 YATES 更正的更多信息。

谢谢

2个回答

关于第二个问题,您可以在哪里找到有关此连续性校正的更多信息(归因于 Yates 在帮助中prop.test但不在下面的参考文献中,我认为因为 Yates 最初仅对列联表的卡方检验提出了连续性校正) :

  1. 纽康 RG。单一比例的双边置信区间:七种方法的比较。统计医学 1998;17(8):857-872。PMID: 9595616

  2. Brown LD, Cai TT, DasGupta A. 二项式比例的区间估计(带有评论和反驳)。统计科学 2001;16(2):101-133。doi: 10.1214/ss/1009213286

连续性校正的 Wilson 得分区间是 Newcomb 中的“方法 4”。布朗等人。仅考虑正文中未校正的 Wilson 得分区间,但 George Casella 建议在他的评论 (p121) 中使用连续性校正版本,其中 Brown 等人。在他们的反驳(p130)中讨论:

Casella 建议在构建置信区间之前对得分统计进行连续性校正的可能性。从任何角度来看,我们都不同意这个提议。这些“连续性校正的威尔逊”区间具有极其保守的覆盖特性,尽管原则上不能保证它们在任何地方都是保守的。但是,即使一个人的目标,不像我们的,是产生保守的区间,这些区间在它们的正常水平上相对于 Blyth-Still 甚至 Clopper-Pearson 将是非常低效的。

Clopper-Pearson '精确' 区间由binom.testR 提供。我建议使用它而不是prop.test如果你想要一个保守的区间,即保证至少95% 覆盖率的区间。如果您更喜欢平均覆盖率接近 95% (超过 p)的区间,因此通常会更窄,您可以使用prop.test(…, correct=FALSE)给出未校正的 Wilson 分数区间。

此类问题的标准教科书是 Fleiss Statistical Methods for Rates and ProportionsNewcomb 引用了 1981 年的原始版本,但最新版本是第 3 版(2003 年)但是,我自己没有检查过。

帮助页面指出“仅当不超过样本和空值比例的绝对值之差时才使用连续性校正”。这就是第 5 行检查的内容:x/n是经验比例,p是空比例。(实际上,我发现“如果”有点误导,因为在查看第 5 行时,它更像是“只要不超过”。)