基于一般线性模型的均值组比较通常被认为对违反方差同质性假设具有一般鲁棒性。然而,在某些情况下绝对不是这种情况,一个相对简单的情况是违反方差同质性假设并且您的组大小存在差异。这种组合可能会增加您的 I 类或 II 类错误率,具体取决于组间方差和样本大小的差异分布。
一系列简单的模拟p-values 会告诉你怎么做。首先,我们来看看如何分配p- 当 null 为真、满足方差同质性假设且组大小相等时,值应该看起来像。我们将为两组(x和y)中的 200 个观察值模拟相等的标准化分数,运行参数t-test,并保存结果p-value(并重复此 10,000 次)。然后我们将绘制模拟的直方图p-价值观:
nSims <- 10000
h0 <-numeric(nSims)
for(i in 1:nSims){
x<-rnorm(n = 200, mean = 0, sd = 1)
y<-rnorm(n = 200, mean = 0, sd = 1)
z<-t.test(x,y, var.equal = T)
h0[i]<-z$p.value
}
hist(h0, main="Histogram of p-values [H0 = T, HoV = T, Cell.Eq = T]", xlab=("Observed p-value"), breaks=100)

的分布p-values 应该是相对统一的。但是,如果我们使组y的标准差是组x的5 倍(即违反方差同质性)呢?

还是蛮统一的。但是,当我们将违反的方差同质性假设与组大小的差异(现在将组x的样本量减少到 20)结合起来时,我们遇到了重大问题。

一组中较大的标准偏差和另一组中较小的组大小的组合在我们的 I 类错误率中产生了相当大的膨胀。但两者的差异也可以反过来发挥作用。相反,如果我们指定一个总体,其中 null 为假(组x的平均值是 0.4 而不是 0),并且一个组(在这种情况下,组y)具有更大的标准偏差和更大的样本量,那么我们实际上可以损害我们检测真实效果的能力:

所以总而言之,当组大小相对相等时,方差同质性不是一个大问题,但是当组大小不相等时(因为它们可能在准实验研究的许多领域中存在),方差同质性真的会夸大你的 I 型或 II 错误率。