卡方总是片面的检验吗?

机器算法验证 假设检验 卡方检验
2022-02-01 04:57:00

一篇已发表的文章 ( pdf ) 包含以下两句话:

此外,误报可能是由于应用了不正确的规则或缺乏对统计测试的了解。例如,ANOVA 中的总 df 可以被视为检验报告中的误差 df,或者研究人员可以将检验报告的 p 值除以 2,以获得一个单向的值,而已经是一个单向的检验。Fχ2Fppχ2F

为什么他们会这么说?卡方检验是一种双边检验。(我问过其中一位作者,但没有得到回应。)

我忽略了什么吗?

4个回答

卡方检验本质上始终是单面检验这是一种松散的思考方式:卡方检验基本上是一种“拟合优度”检验。有时它被明确地称为这样,但即使不是这样,它本质上仍然通常是一种拟合优度。例如,在 2 x 2 频率表上的卡方独立性检验是(某种程度上)第一行(列)与第二行(列)指定的分布的拟合优度检验,反之亦然, 同时地。因此,当实现的卡方值在其分布的右尾偏出时,表明拟合不佳,如果它足够远,相对于某个预先指定的阈值,我们可能会得出结论,它太差了,以至于我们不相信这些数据来自那个参考分布。

如果我们将卡方检验用作双边检验,我们也会担心统计量是否离卡方分布的左侧太远。这意味着我们担心合身可能太好了这根本不是我们通常担心的事情。(作为历史的旁注,这与孟德尔是否伪造他的数据的争议有关。这个想法是他的数据好得令人难以置信。如果你好奇,请参阅此处了解更多信息。)

卡方总是片面的检验吗?

这实际上取决于两件事:

  1. 正在测试什么假设。如果您要根据指定值测试正态数据的方差,则很可能要处理卡方的上尾或下尾(单尾),或分布的两个尾。我们必须记住型统计量并不是镇上唯一的卡方检验!(OE)2E

  2. 人们是否在谈论替代假设是单边的还是双边的(因为有些人使用“双尾”来指代双边替代假设,而不管统计数据的抽样分布会发生什么。这有时可以是例如,如果我们正在查看一个两个样本的比例测试,有人可能会在 null 中写出两个比例相等,而在替代中写出π1π2然后将其称为“双尾”,但使用卡方而不是 z 检验对其进行测试,因此仅查看测试统计量分布的上尾(因此它是两条尾的样本比例差异的分布,但根据从中获得的卡方统计量的分布而出现尾随 - 与如果您进行 t-test statistc的方式大致相同,您只是观察分布中的一条尾巴)。|T||T|

也就是说,我们必须非常小心使用“卡方检验”要涵盖的内容,并准确说明“单尾”与“双尾”的含义。

在某些情况下(我提到了两个;可能还有更多),将其称为双尾可能是完全合理的,或者如果您接受术语使用有些松散,则称其为双尾可能是合理的。

如果您将讨论限制在特定类型的卡方检验,那么说它只是单尾可能是一个合理的说法。

的假设的卡方检验 ^2可以是单尾或双尾,其意义与 t 检验的假设可以是单尾或双尾。(n1)s2/σ2σ2(mμ)n/sμ

我也遇到了一些问题来解决这个问题,但是经过一些实验后,我的问题似乎只是测试的命名方式。

以 SPSS 为例,2x2 表可以添加卡方检验。p 值有两列,一列用于“Pearson Chi-Sqare”、“连续性校正”等,另一列用于 Fisher 精确检验,其中一列用于 2 面检验,另一列用于单面测试。

我首先认为 1 面和 2 面表示卡方检验的 1 面或 2 面版本,这似乎很奇怪。然而事实证明,这表示在比例差异检验(即 z 检验)中替代假设的基本公式。因此,在 SPSS 中,通常合理的比例 2 边检验是通过卡方检验实现的,其中卡方度量与分布的(1 边)上尾中的值进行比较。猜猜这是对原始问题的其他回答已经指出的,但我花了一些时间才意识到这一点。

顺便说一句,openepi.com 和可能的其他系统也使用了相同的公式。