注意:我原来的例子有问题。我愚蠢地被 R 的无声参数回收抓住了。我的新示例与我的旧示例非常相似。希望现在一切正常。
这是我制作的一个示例,其方差分析在 5% 的水平上显着,但 6 个成对比较中没有一个是显着的,即使在 5% 的水平上也是如此。
这是数据:
g1: 10.71871 10.42931 9.46897 9.87644
g2: 10.64672 9.71863 10.04724 10.32505 10.22259 10.18082 10.76919 10.65447
g3: 10.90556 10.94722 10.78947 10.96914 10.37724 10.81035 10.79333 9.94447
g4: 10.81105 10.58746 10.96241 10.59571
这是方差分析:
Df Sum Sq Mean Sq F value Pr(>F)
as.factor(g) 3 1.341 0.4469 3.191 0.0458 *
Residuals 20 2.800 0.1400
这是两个样本 t 检验 p 值(等方差假设):
g2 g3 g4
g1 0.4680 0.0543 0.0809
g2 0.0550 0.0543
g3 0.8108
通过对组均值或单个点进行更多的摆弄,可以使显着性差异更加显着(因为我可以使第一个 p 值更小,并使 t 检验的六个 p 值中的最低值更高)。
--
编辑:这是一个额外的例子,它最初是用关于趋势的噪音产生的,它显示了如果你稍微移动点可以做得更好:
g1: 7.27374 10.31746 10.54047 9.76779
g2: 10.33672 11.33857 10.53057 11.13335 10.42108 9.97780 10.45676 10.16201
g3: 10.13160 10.79660 9.64026 10.74844 10.51241 11.08612 10.58339 10.86740
g4: 10.88055 13.47504 11.87896 10.11403
F 的 p 值低于 3%,并且没有一个 t 的 p 值低于 8%。(对于 3 组示例 - 但 F 上的 p 值稍大 - 省略第二组)
这是一个非常简单的例子,如果更人为的话,有 3 个组:
g1: 1.0 2.1
g2: 2.15 2.3 3.0 3.7 3.85
g3: 3.9 5.0
(在这种情况下,最大的方差在中间组 - 但由于那里的样本量较大,组均值的标准误差仍然较小)
多重比较 t 检验
whuber 建议我考虑多重比较的情况。事实证明这很有趣。
多重比较的情况(全部在原始显着性水平上进行 - 即不调整多重比较的 alpha)有点难以实现,因为在不同组中使用更大和更小的方差或更多和更少的 df 无济于事与普通的两样本 t 检验一样。
但是,我们仍然有操纵组数和显着性水平的工具;如果我们选择更多的组和更小的显着性水平,那么识别案例就变得相对简单了。这是一个:
取八组。将前四组中的值定义为 (2,2.5),将后四组中的值定义为 (3.5,4),并取
(例如)。然后我们有一个显着的 F:ni=2α=0.0025
> summary(aov(values~ind,gs2))
Df Sum Sq Mean Sq F value Pr(>F)
ind 7 9 1.286 10.29 0.00191
Residuals 8 1 0.125
然而,成对比较中的最小 p 值在该水平上并不显着:
> with(gs2,pairwise.t.test(values,ind,p.adjust.method="none"))
Pairwise comparisons using t tests with pooled SD
data: values and ind
g1 g2 g3 g4 g5 g6 g7
g2 1.0000 - - - - - -
g3 1.0000 1.0000 - - - - -
g4 1.0000 1.0000 1.0000 - - - -
g5 0.0028 0.0028 0.0028 0.0028 - - -
g6 0.0028 0.0028 0.0028 0.0028 1.0000 - -
g7 0.0028 0.0028 0.0028 0.0028 1.0000 1.0000 -
g8 0.0028 0.0028 0.0028 0.0028 1.0000 1.0000 1.0000
P value adjustment method: none