机器算法验证 - 卡方总是片面的检验吗？ - 吾爱随笔录

卡方总是片面的检验吗？

机器算法验证假设检验卡方检验

2022-02-01 04:57:00

一篇已发表的文章 ( pdf ) 包含以下两句话：

此外，误报可能是由于应用了不正确的规则或缺乏对统计测试的了解。例如，ANOVA 中的总 df 可以被视为检验报告中的误差 df，或者研究人员可以将或检验报告的 p 值除以 2，以获得一个单向的值，而或值已经是一个单向的检验。 $F$ $\chi^2$ $F$ $p$ $p$ $\chi^2$ $F$

为什么他们会这么说？卡方检验是一种双边检验。（我问过其中一位作者，但没有得到回应。）

我忽略了什么吗？

4个回答

卡方检验本质上始终是单面检验。这是一种松散的思考方式：卡方检验基本上是一种“拟合优度”检验。有时它被明确地称为这样，但即使不是这样，它本质上仍然通常是一种拟合优度。例如，在 2 x 2 频率表上的卡方独立性检验是（某种程度上）第一行（列）与第二行（列）指定的分布的拟合优度检验，反之亦然，同时地。因此，当实现的卡方值在其分布的右尾偏出时，表明拟合不佳，如果它足够远，相对于某个预先指定的阈值，我们可能会得出结论，它太差了，以至于我们不相信这些数据来自那个参考分布。

如果我们将卡方检验用作双边检验，我们也会担心统计量是否离卡方分布的左侧太远。这意味着我们担心合身可能太好了。这根本不是我们通常担心的事情。（作为历史的旁注，这与孟德尔是否伪造他的数据的争议有关。这个想法是他的数据好得令人难以置信。如果你好奇，请参阅此处了解更多信息。）

卡方总是片面的检验吗？

这实际上取决于两件事：

正在测试什么假设。如果您要根据指定值测试正态数据的方差，则很可能要处理卡方的上尾或下尾（单尾），或分布的两个尾。我们必须记住型统计量并不是镇上唯一的卡方检验！ $\frac{(O-E)^2} E$
人们是否在谈论替代假设是单边的还是双边的（因为有些人使用“双尾”来指代双边替代假设，而不管统计数据的抽样分布会发生什么。这有时可以是例如，如果我们正在查看一个两个样本的比例测试，有人可能会在 null 中写出两个比例相等，而在替代中写出 $\pi_1 \neq \pi_2$ 然后将其称为“双尾”，但使用卡方而不是 z 检验对其进行测试，因此仅查看测试统计量分布的上尾（因此它是两条尾的样本比例差异的分布，但根据从中获得的卡方统计量的分布而出现尾随 - 与如果您进行 t-test statistc的方式大致相同，您只是观察分布中的一条尾巴）。 $|T|$ $|T|$

也就是说，我们必须非常小心使用“卡方检验”要涵盖的内容，并准确说明“单尾”与“双尾”的含义。

在某些情况下（我提到了两个；可能还有更多），将其称为双尾可能是完全合理的，或者如果您接受术语使用有些松散，则称其为双尾可能是合理的。

如果您将讨论限制在特定类型的卡方检验，那么说它只是单尾可能是一个合理的说法。

的假设的卡方检验 ^2可以是单尾或双尾，其意义与 t 检验的假设可以是单尾或双尾。 $(n-1)s^2/\sigma^2$ $\sigma^2$ $(m-\mu)\sqrt{n}/s$ $\mu$

我也遇到了一些问题来解决这个问题，但是经过一些实验后，我的问题似乎只是测试的命名方式。

以 SPSS 为例，2x2 表可以添加卡方检验。p 值有两列，一列用于“Pearson Chi-Sqare”、“连续性校正”等，另一列用于 Fisher 精确检验，其中一列用于 2 面检验，另一列用于单面测试。

我首先认为 1 面和 2 面表示卡方检验的 1 面或 2 面版本，这似乎很奇怪。然而事实证明，这表示在比例差异检验（即 z 检验）中替代假设的基本公式。因此，在 SPSS 中，通常合理的比例 2 边检验是通过卡方检验实现的，其中卡方度量与分布的（1 边）上尾中的值进行比较。猜猜这是对原始问题的其他回答已经指出的，但我花了一些时间才意识到这一点。

顺便说一句，openepi.com 和可能的其他系统也使用了相同的公式。

其它你可能感兴趣的问题

上一篇CNN中“内核”和“过滤器”的区别下一篇具有对数转换响应的线性模型与具有对数链接的广义线性模型