在卡方检验中不满足假设时该怎么办?

机器算法验证 spss 卡方检验 假设
2022-03-28 06:37:11

我正在对“先验分割”进行分析。为了检查两个部分之间的显着差异,使用了交叉表和卡方检验。

变量类型:分类

样本量:253

使用的程序:SPSS 21 版。

问题:在几个方面,卡方检验的假设没有得到满足。在某些表格下写成(例如):4 个细胞 (22.2%) 的预期计数小于 5。最小预期计数为 1.85 或 7 个细胞 (50.0%) 的预期计数小于 5。最小预期计数为 0.26 . 或 10 个细胞 (62.5%) 的预期计数小于 5。最小预期计数为 0.26。

在这种情况下应该怎么做?应该避免卡方检验吗?可以改用哪种测试?文献表明,对于 2x2 列联表,可以使用 Fisher 精确检验。更大的列联表(包含多个类别的变量)应该怎么做?

2个回答

一种解决方案是使用引导测试作为置换测试的近似值。置换测试是精确且最强大的;在这种情况下,有太多的排列来计算它们中的每一个,所以你可以用 bootstrap 来近似测试。

基本上,你:

1)计算您的测试统计量,将其标记为,在实际数据上,出于说明目的说您已经计算过的相同卡方统计量,T0

2)在假设原假设为真的情况下构造 1,000 或 10,000 个左右(“许多”)随机列联表,并为每个列计算卡方统计量,将它们标记为T1TB

3)将您的测试统计值与随机生成的列联表中的测试统计值进行比较,看看哪个分数比更极端;这为您提供了一个引导 p 值。 T0T1TBT0

我们通过在原假设下随机生成大量检验统计量值来逼近原假设下检验统计量的分布;这让我们可以估计与我们实际观察到的统计值相关的 p 值。

不幸的是,我无法帮助您解决其中的 SPSS 部分。

这是我过去发现有用的参考:Permutation, Parametric, and Bootstrap Tests of Hypotheses (Good)

在 SPSS 交叉表过程中,您可以使用精确测试和/或您可以使用引导程序。Exact 提供了蒙特卡洛和精确的选择。Bootstrap 提供了可用于一系列程序的相同引导技术。如果您有相关的附加选项,则两者都可以从“交叉表”对话框中获得。