为什么我们在方差分析 (ANOVA) 中使用单尾检验 F 检验?

机器算法验证 方差分析 f检验 平方和 f-分布
2022-03-01 18:21:05

你能给出在方差分析中使用单尾检验的原因吗?

为什么我们在 ANOVA 中使用单尾检验——F 检验?

3个回答

F 检验最常用于两个目的:

  1. 在 ANOVA 中,用于测试均值(以及各种类似分析);

  2. 在检验方差相等时

让我们依次考虑:

1) ANOVA 中的 F 检验(以及类似的计数数据的常见卡方检验)的构造使得数据与备择假设越一致,检验统计量往往越大,而样本的排列看起来与空值最一致的数据对应于检验统计量的最小值。

考虑三个样本(大小为 10,样本方差相等),并将它们排列为具有相等的样本均值,然后以不同的模式移动它们的均值。随着样本均值的变化从零开始增加,F 统计量变得更大:

3个样本的排列和相应的F统计量

黑线()是数据值。粗红线 ( ) 是组均值。||

如果原假设(总体均值相等)为真,您会预期样本均值会有一些变化,并且通常会预期看到 F 比率大约在 1 左右。较小的 F 统计数据来自比您通常更靠近的样本期望......所以你不会得出人口意味着不同的结论。

也就是说,对于 ANOVA,当您获得异常大的 F 值时,您将拒绝均值相等的假设,并且当您获得异常小的值时,您不会拒绝均值相等的假设(它可能表明某些东西,但不是人口意味着不同)。

这是一个可以帮助您了解我们只想在 F 位于其上尾时拒绝的示例:

ANOVA 的 F 描述,当 F 统计量在上尾时拒绝

2) F 检验方差相等*(基于方差比)。在这里,如果分子样本方差远大于分母方差,则两个样本方差估计的比率会很大,如果分母样本方差远大于分子方差,则比率会很小。

也就是说,为了测试总体方差的比率是否不同于 1,您需要拒绝 F 的大值和小值的空值。

*(撇开对这个测试的分布假设的高敏感性问题(有更好的选择)以及如果您对 ANOVA 等方差假设的适用性感兴趣的问题,您的最佳策略可能不是正式测试。)

必须理解,ANOVA 的目标是检查是否存在均值不平等……这意味着与样本内的变化相比,我们关注样本之间的大变化(因此意味着从均值计算出的变化) (再次从单个样本平均值计算)。当样本之间的差异很小(导致 F 值在左侧)时,这无关紧要,因为这种差异是微不足道的。如果样本之间的变化显着高于内部变化,则样本之间的变化很重要,在这种情况下,F 值将大于 1,因此在右尾。

剩下的唯一问题是为什么将整个重要性级别放在右尾,答案又是相似的。只有当 F 比在右侧时才会发生拒绝,而当 F 比在左侧时不会发生。显着性水平是由于统计限制而导致的误差的度量。由于拒绝仅发生在右侧,因此整个重要性级别(错误结论的错误风险)都保留在右侧。`

处理内均方 (MS) 的预期值是总体方差,而处理间 MS 的预期值是总体方差加上处理方差。因此,F = MSbetween / MSwithin 的比率始终大于 1,并且永远不会小于 1。

由于 1 尾测试的精度优于 2 尾测试,因此我们更喜欢使用 1 尾测试。