2 x 2 列联表的 Yates 连续性校正

机器算法验证 分类数据 卡方检验 yates-校正
2022-03-29 16:36:57

我想从现场人员那里收集有关 2 x 2 列联表的 Yates 连续性校正的意见。维基百科文章提到它可能调整得太远,因此仅在有限的意义上使用。这里的相关帖子没有提供更多的见解。

那么对于经常使用这些测试的人,你的想法是什么?使用校正是否更好?

还有一个真实世界的例子,它会在 95% 的置信水平下产生不同的结果。请注意,这是一个家庭作业问题,但我们的课程根本不处理 Yates 连续性校正,所以知道你没有为我做作业,所以睡个好觉。

samp <- matrix(c(13, 12, 15, 3), byrow = TRUE, ncol = 2)
colnames(samp) <- c("No", "Yes")
rownames(samp) <- c("Female", "Male")

chisq.test(samp, correct = TRUE)
chisq.test(samp, correct = FALSE)    
2个回答

Yates 的修正导致比 Fisher 的“精确”检验更保守的检验。

这是 Stefanescu 等人编写的关于使用Yates 连续性校正的在线教程,它清楚地指出了系统性连续性校正的各种缺陷(第 4-6 页)。引用 Agresti ( CDA 2002),“Yates (1934) 提到 Fisher 建议他使用超几何进行精确检验”,这导致了χ2. Agresti 还指出,Fisher 检验是一个很好的选择,因为计算机甚至可以对大样本进行检验(第 103 页)。现在,重点是选择测试实际上取决于所问的问题和每个测试所做的假设(例如,在 Fisher 测试的情况下,我们假设边距是固定的)。

在您的情况下,Fisher 测试并纠正χ2同意并屈服p- 值高于 5%。在普通的情况下χ2, 如果p- 值是使用蒙特卡洛方法计算的(请参阅 参考资料simulate.p.value),然后它也无法达到显着性。

处理小样本量问题和过度使用 Fisher 检验的其他有用参考资料包括:

如果您的计数足够低以至于 Yates 校正令人担忧(如您的示例),您可能应该使用 Fisher 精确检验。否则,我建议您在 2x2 表上使用卡方检验后,使用对数优势比 z 检验确认您的检验。