两样本 tt-test 与 Tukey 方法

机器算法验证 方差分析 t检验 多重比较 tukey-hsd-测试
2022-03-01 00:46:34

即使 ANOVA 检验中的 F 统计量是显着的,我们也可能需要在得出结论之前进行进一步的检验。最常用的方法是使用多重比较程序。我试图理解为什么在两个样本 t-test 上使用 Tukey 的方法。我阅读了以下内容,其中建议进行所有成对测试(可能意味着两个样本 t-tests)可能导致误报(I 类错误)。为什么这会在概念上发生?

Tukey 的过程允许我们进行单独的测试,以确定在 k 总体均值的 ANOVA 研究中,对于每对均值是否 μi=μj与所有多重比较程序一样,Tukey 方法基于选择适用于整个成对假设检验集合的“家族”显着性水平 α例如,当使用显着性水平为 5% 的 Tukey 过程时,我们确信在整组成对检验中获得假阳性的机会最多为 5%,也就是说,有最多有 5% 的机会错误地断定两个总体均值不同,而实际上它们是相等的。这与简单地将所有成对测试作为单独测试进行非常不同,每个测试都在 α=0.05

1个回答

很简单,如果(在没有影响的零假设下)有 5% 的机会,比如说,在20 次测试中的每一次测试中都有 5% 的机会出现假阳性;在这 20 项测试中的任何一项中,出现假阳性的可能性都超过 5% 。如果测试是独立的,则没有得到假阳性的变化95%20=35.8%,因此至少有一个假阳性的机会是 64.2%——这是多重比较测试控制的家庭错误。当然,ANOVA 后所有均值的成对比较不是独立的,Tukey 检验考虑了这一点。