机器算法验证 - 如果许多细胞的频率小于 5，则卡方检验的适用性 - 吾爱随笔录

机器算法验证卡方检验非参数列联表关联度量

2022-01-20 04:33:04

为了找到同伴的支持（自变量）和工作满意度（因变量）之间的关联，我希望应用卡方检验。同伴的支持根据支持程度分为四组：1=非常少，2=有一定程度，3=很大程度，4=很大程度。工作满意度分为两类：0=不满意，1=满意。

SPSS 输出显示 37.5% 的单元格频率小于 5。我的样本量为 101，我不想将自变量中的类别减少到更少的数量。在这种情况下，是否有任何其他测试可以用来测试这种关联？

2个回答

Conover (1999:202) 建议期望值可以“小至 0.5，只要大多数大于 1.0，而不会危及测试的有效性”。

他还提供了来自 Cochran (1952) 的“经验法则”，该法则表明，如果预期值小于 1 或超过 20% 的值小于 5，则测试可能会表现不佳。然而，Conover (1999) 提供了一些证据表明 Cochran 的“经验法则”过于保守。

参考

Cochran, WG 1952。拟合优度数理统计年鉴 23：315-345。 $\chi^2$

Conover, WJ 1999。实用非参数统计。第三版。John Wiley & Sons, Inc.，纽约，纽约，美国。

这 $\chi^2$ -test 最初由 Pearson 设计为对数似然比的近似值，因为当时对数似然的计算量太大。

Pearson 的 G 定义为 $G = 2\sum_{ij}O_{ij}\ln(O_{ij}/E_{ij})$ . 它遵循与对应的相同分布 $\chi^2$ -测试。

（最初忘记提及：G 对预期的细胞计数 < 5 的敏感性要低得多）。

其它你可能感兴趣的问题