卡方拟合优度检验的事后检验

机器算法验证 假设检验 卡方检验 拟合优度 事后
2022-02-02 23:24:00

我正在对三个类别进行卡方拟合优度 (GOF) 测试,并且特别想测试每个类别中的总体比例相等的空值(即,每组中的比例为 1/3):

                观测数据
第 1     组 第 2     组 第 3 组     总计
  686 928 1012 2626

因此,对于此 GOF 测试,预期计数为 2626(1/3) = 875.333,并且该测试产生了一个非常显着的p值 < 0.0001。

现在,很明显第 1 组与第 2 组和第 3 组显着不同,第 2 组和第 3 组不太可能有显着不同。但是,如果我确实想正式测试所有这些并能够为每种情况提供一个p值,那么合适的方法是什么?

我在网上搜索过,似乎有不同的意见,但没有正式的文件。我想知道是否有文本或同行评审的论文来解决这个问题。

在我看来合理的是,鉴于显着的整体测试,对每对比例的差异进行z值进行校正(例如 Bonferroni)。α

2个回答

令我惊讶的是,一些搜索似乎并没有出现先前关于拟合优度的事后讨论。我希望这里的某个地方可能有一个,但由于我无法轻松找到它,我认为将我的评论变成答案是合理的,这样人们至少可以使用我刚刚使用的相同搜索词找到这个。

您寻求进行的成对比较(仅比较所涉及的两组的条件)是明智的。

这相当于采取组对并测试其中一组中的比例是否不同于 1/2(单样本比例测试)。这 - 正如你所建议的 - 可以作为 z 检验完成(尽管二项式检验和卡方拟合优度也可以)。

处理总体 I 类错误率的许多常用方法在这里应该有效(包括 Bonferroni ——以及随之而来的常见问题)。

我遇到了同样的问题(很高兴找到这篇文章)。我现在还在 Sheskin (2003: 225) 中找到了关于这个问题的简短说明,我只想分享:

“可以进行的另一种比较类型是将原始六个单元格中的两个相互对比。具体来说,让我们假设我们想要比较单元格 l/星期一和单元格 2/星期二 [...] 请注意,在上面的例子,由于我们只使用了两个单元格,每个单元格的概率将是 π_i = 1/2。每个单元格的预期频率是通过将 π_i = 1/2 乘以两个单元格中的观察总数(即等于 34)。如前所述,在进行上述比较时,研究人员必须解决的一个关键问题是在评估零假设时使用的 alpha 值。

Sheskin, DJ 2003。参数和非参数统计程序手册:第三版。CRC出版社。