对比的 Scheffé 检验是事后检验的“最佳情况”吗?

机器算法验证 假设检验 方差分析 多重比较 对比
2022-04-13 12:34:40

我正在阅读《解释心理统计》,第 4 版,并在以下段落之后被难住了:

Scheffé (1953) 明白,任何人在创建复杂对比时所能做的最好的事情就是捕捉所有的SSbet[组间偏差的平方和] 在单 df 比较中,因此SSbet除以 1,而不是dfbet[组间的自由度]。因此,在最好的情况下,MScontrast[组间方差的均值] 等于dfbetMSbet, 和Fcontrast[Scheffé 检验的 F 比] 等于dfbetFANOVA[原始方差分析中的 F 比率]。

这是在计划对比部分之后,并且 Scheffé 测试被描述为特别保守,所以我很困惑。Scheffé 的测试在什么意义上是“最佳情况”?我似乎能从这个和在线进一步阅读中得到的是,Scheffé 的测试描述了事后测试中的最佳情况,但计划的对比可能具有更高的能力来补偿它们的特异性。这是对事物的正确认识吗?

1个回答

首先,有很多测试,每个测试都有其优点和缺点。一些最基本的测试是 Tukey's、Bonferroni's 和 Scheffés,因此我们可以比较和对比这些测试以了解选择测试的内容。

在测试之间进行选择的有用解释(http://www.itl.nist.gov/div898/handbook/prc/section4/prc473.htm):

  1. 如果所有成对比较都感兴趣,则 Tukey 具有优势。如果只需要成对比较的一个子集,Bonferroni 有时可能会更好。

  2. 当要估计的对比数量很少时,(大约与因子一样多)Bonferroni 优于 Scheffé。实际上,除非所需对比的数量至少是因子数量的两倍,否则 Scheffé 将始终显示比 Bonferroni 更宽的置信带。

  3. 许多计算机软件包包括所有三种方法。因此,研究输出并选择置信带最小的方法。编辑:(这在源代码中列出,但可能不是一个好主意)。

  4. 在所有方法中,没有单一的多重比较方法是最好的。

这是选择正确测试的简化决策树(http://www.statsdirect.com/help/content/analysis_of_variance/multiple_comparisons.htm):

  • 成对的

    • 相等的组大小:Tukey
    • 不等的群体规模:Tukey-Kramer 或 Scheffé's
  • 不是成对的

    • 计划:邦费罗尼
    • 未计划:Scheffé's

切线:

此外,您需要了解计划内比较和计划外比较之间的区别。如果您知道要比较的每个比较,则可以使用计划的比较测试,例如 Tukey 和 Bonferroni。如果您认为您可能需要进行一些臭名昭著的数据窥探,那么您至少可以针对与 Scheffé 方法的计划外比较进行调整。(图基: http://www.itl.nist.gov/div898/handbook/prc/section4/prc471.htm ,邦费罗尼:http : //www.itl.nist.gov/div898/handbook/prc/section4/prc473 .htm , Scheffé: http://www.itl.nist.gov/div898/handbook/prc/section4/prc472.htm )

一般来说,如果可能,不要进行数据窥探(计划外比较)。您需要了解您正在寻找什么(计划比较),并且在决定哪种测试是最好的之前,应该咨询专业的统计学家。此外,了解您正在测试的数据将使您能够进行特定的比较,从而允许您使用特定的测试,该测试可以为您提供最窄的置信区间(检测差异),同时在统计上是正确的。