一篇已发表的文章 ( pdf ) 包含以下两句话:
此外,误报可能是由于应用了不正确的规则或缺乏对统计测试的了解。例如,ANOVA 中的总 df 可以被视为检验报告中的误差 df,或者研究人员可以将或检验报告的 p 值除以 2,以获得一个单向的值,而或值已经是一个单向的检验。
为什么他们会这么说?卡方检验是一种双边检验。(我问过其中一位作者,但没有得到回应。)
我忽略了什么吗?
一篇已发表的文章 ( pdf ) 包含以下两句话:
此外,误报可能是由于应用了不正确的规则或缺乏对统计测试的了解。例如,ANOVA 中的总 df 可以被视为检验报告中的误差 df,或者研究人员可以将或检验报告的 p 值除以 2,以获得一个单向的值,而或值已经是一个单向的检验。
为什么他们会这么说?卡方检验是一种双边检验。(我问过其中一位作者,但没有得到回应。)
我忽略了什么吗?
卡方检验本质上始终是单面检验。这是一种松散的思考方式:卡方检验基本上是一种“拟合优度”检验。有时它被明确地称为这样,但即使不是这样,它本质上仍然通常是一种拟合优度。例如,在 2 x 2 频率表上的卡方独立性检验是(某种程度上)第一行(列)与第二行(列)指定的分布的拟合优度检验,反之亦然, 同时地。因此,当实现的卡方值在其分布的右尾偏出时,表明拟合不佳,如果它足够远,相对于某个预先指定的阈值,我们可能会得出结论,它太差了,以至于我们不相信这些数据来自那个参考分布。
如果我们将卡方检验用作双边检验,我们也会担心统计量是否离卡方分布的左侧太远。这意味着我们担心合身可能太好了。这根本不是我们通常担心的事情。(作为历史的旁注,这与孟德尔是否伪造他的数据的争议有关。这个想法是他的数据好得令人难以置信。如果你好奇,请参阅此处了解更多信息。)
卡方总是片面的检验吗?
这实际上取决于两件事:
正在测试什么假设。如果您要根据指定值测试正态数据的方差,则很可能要处理卡方的上尾或下尾(单尾),或分布的两个尾。我们必须记住型统计量并不是镇上唯一的卡方检验!
人们是否在谈论替代假设是单边的还是双边的(因为有些人使用“双尾”来指代双边替代假设,而不管统计数据的抽样分布会发生什么。这有时可以是例如,如果我们正在查看一个两个样本的比例测试,有人可能会在 null 中写出两个比例相等,而在替代中写出然后将其称为“双尾”,但使用卡方而不是 z 检验对其进行测试,因此仅查看测试统计量分布的上尾(因此它是两条尾的样本比例差异的分布,但根据从中获得的卡方统计量的分布而出现尾随 - 与如果您进行 t-test statistc的方式大致相同,您只是观察分布中的一条尾巴)。
也就是说,我们必须非常小心使用“卡方检验”要涵盖的内容,并准确说明“单尾”与“双尾”的含义。
在某些情况下(我提到了两个;可能还有更多),将其称为双尾可能是完全合理的,或者如果您接受术语使用有些松散,则称其为双尾可能是合理的。
如果您将讨论限制在特定类型的卡方检验,那么说它只是单尾可能是一个合理的说法。
的假设的卡方检验 ^2可以是单尾或双尾,其意义与 t 检验的假设可以是单尾或双尾。
我也遇到了一些问题来解决这个问题,但是经过一些实验后,我的问题似乎只是测试的命名方式。
以 SPSS 为例,2x2 表可以添加卡方检验。p 值有两列,一列用于“Pearson Chi-Sqare”、“连续性校正”等,另一列用于 Fisher 精确检验,其中一列用于 2 面检验,另一列用于单面测试。
我首先认为 1 面和 2 面表示卡方检验的 1 面或 2 面版本,这似乎很奇怪。然而事实证明,这表示在比例差异检验(即 z 检验)中替代假设的基本公式。因此,在 SPSS 中,通常合理的比例 2 边检验是通过卡方检验实现的,其中卡方度量与分布的(1 边)上尾中的值进行比较。猜猜这是对原始问题的其他回答已经指出的,但我花了一些时间才意识到这一点。
顺便说一句,openepi.com 和可能的其他系统也使用了相同的公式。