对于任何 2 x X 列联表上的卡方,是否应不超过 20% 的单元格小于 5?

机器算法验证 卡方检验 假设
2022-03-22 20:36:07

在 1999 年的书中,Yates、Moore 和 McCabe 指定不超过 20% 的预期计数应小于 5,并且所有单个预期计数应大于 1。

这是否意味着,对于任何 2 x X 列联表,不超过 20% 的单元格应小于 5?

那么,对于不超过 2 个的 2 x 5 表(10 个中的 2 个单元格 = 20%)应该小于 5 个?

3个回答

我熟悉这本书的早期版本,但我没有看到你所指的具体 idscussion。所以我不确定他们在做什么,但我认为我有一个很好的主意。列联表的卡方检验仅渐近有效。因此,零分布需要较大的样本量才能近似正确,以便测试有效并且 p 值近似正确。

对于 RxC 表,当行和列维度变大时,问题会变得更糟。许多年前,William Cochran 有一条经验法则,建议如果所有单元格都大于 5,则卡方近似值会很好。我相信作者和其他人可能一直在做额外的研究,看看他们是否能提出一个不那么严格的规则。显然有规则是你应该有少于 20% 的单元格的预期计数为 5 或更少。如果原假设为真,则预期计数是您希望在单元格中拥有的数字。如果许多单元格的预期计数小于 5,则表明存在大量稀疏单元格并且测试无效。

所有单元格中至少有 1 个计数的附加要求是与单元格稀疏度相关的另一个要求。为了清楚起见,让我们举个例子。假设 R 为 5,C 为 10。那么您有 50 个单元格。这50个牢房中的每个人都应该至少有一个案例。由于 20% 是 10 个单元格,您将根据假设列之间独立的公式计算每个单元格的预期计数。作者说,如果没有空单元格并且在 50 个单元格中不超过 10 个单元格中计算的期望计数小于 5,他们只会建议使用卡方近似。

对@MichaelChernick 和@juba +1。我听说过这个规则,我相信 Agresti 在他关于分类数据分析的书中也提到了它。但是请注意,该规则和 Cochran 的原始规则(即所有单元格的预期值 > 5)都适用于预期计数,而不是观察到的计数。这很滑,看起来有点像你从第一段到第二段在两者之间滑动。

我所知道的关于这些问题的最佳资源是:

我在这里列出了很多关于卡方和相关测试的相关信息:列联表:要做什么测试,什么时候做?

另一方面,对于实际计数很少的小型列联表,有一个合理的问题是,这些天我们是否应该始终只使用费舍尔精确检验。(请注意,这就是@juba 所指的内容,正如您在引文末尾看到的那样。)这里有一个关于 CV 的非常好的讨论(尽管主要反对使用 Fisher 的测试):鉴于计算机的功能,这些天,有没有理由不做卡方检验而不是费舍尔的精确检验?

只是为了记录,chisq.testR中的函数有一个选项,它允许通过随机生成给定数量的独立表而不是从卡方分布中导出来模拟p值:

chisq.test(x, y, simulate.p.value=TRUE, B=2000)

从功能帮助页面:

 If ‘simulate.p.value’ is ‘FALSE’, the p-value is computed from the
 asymptotic chi-squared distribution of the test statistic;
 continuity correction is only used in the 2-by-2 case (if
 ‘correct’ is ‘TRUE’, the default).  Otherwise the p-value is
 computed for a Monte Carlo test (Hope, 1968) with ‘B’ replicates.

 In the contingency table case simulation is done by random
 sampling from the set of all contingency tables with given
 marginals, and works only if the marginals are strictly positive.
 (A C translation of the algorithm of Patefield (1981) is used.)
 Continuity correction is never used, and the statistic is quoted
 without it.  Note that this is not the usual sampling situation
 assumed for the chi-squared test but rather that for Fisher's
 exact test.

这可能是一种无需担心预期计数即可估算 p 值的方法。