如果许多细胞的频率小于 5,则卡方检验的适用性

机器算法验证 卡方检验 非参数 列联表 关联度量
2022-01-20 04:33:04

为了找到同伴的支持(自变量)和工作满意度(因变量)之间的关联,我希望应用卡方检验。同伴的支持根据支持程度分为四组:1=非常少,2=有一定程度,3=很大程度,4=很大程度。工作满意度分为两类:0=不满意,1=满意。

SPSS 输出显示 37.5% 的单元格频率小于 5。我的样本量为 101,我不想将自变量中的类别减少到更少的数量。在这种情况下,是否有任何其他测试可以用来测试这种关联?

2个回答

Conover (1999:202) 建议期望值可以“小至 0.5,只要大多数大于 1.0,而不会危及测试的有效性”。

他还提供了来自 Cochran (1952) 的“经验法则”,该法则表明,如果预期值小于 1 或超过 20% 的值小于 5,则测试可能会表现不佳。然而,Conover (1999) 提供了一些证据表明 Cochran 的“经验法则”过于保守。

参考

Cochran, WG 1952。拟合优度数理统计年鉴 23:315-345。χ2

Conover, WJ 1999。实用非参数统计。第三版。John Wiley & Sons, Inc.,纽约,纽约,美国。

χ2-test 最初由 Pearson 设计为对数似然比的近似值,因为当时对数似然的计算量太大。

Pearson 的 G 定义为G=2ijOijln(Oij/Eij). 它遵循与对应的相同分布χ2-测试。

(最初忘记提及:G 对预期的细胞计数 < 5 的敏感性要低得多)。