以@Isabella 的评论为开端。以下是一些可能与您的数据非常相似的虚假数据,以供讨论。我不知道你是否使用 R 统计软件,但其他类型的软件会对这些数据做同样的事情。
set.seed(907)
a = rnorm(8, 13, 7) # alcoholics
n = rnorm(8, 15, 5) # non
x = rnorm(8, 20, 5) # ex
y=c(a,n,x) # data in stacked format
g=as.factor(rep(1:3, 8)) # group number 1, 2, 3
首先看描述性统计,也许回顾一下 DF 的均值以及哪些信息进入 SS(Group)(组均值)和 SS(Error) [组方差]。那么哪些部门会导致 F 统计量。然后将 ANOVA 表分开。
summary(a); sd(a)
Min. 1st Qu. Median Mean 3rd Qu. Max.
3.655 8.117 12.896 12.464 15.293 20.847
[1] 5.919241 # sd of gp a
summary(n); sd(n)
Min. 1st Qu. Median Mean 3rd Qu. Max.
3.597 11.780 15.221 14.672 20.023 21.437
[1] 6.276581
summary(x); sd(x)
Min. 1st Qu. Median Mean 3rd Qu. Max.
11.60 14.68 17.28 17.15 18.01 25.16
[1] 4.046853
各自的平均值大约是 13、15、17,所以可能会有影响。中位数显示出类似的模式。
查看数据的条形图(或点图)。你看有什么不同吗?为什么手段之间的差异没有表现得更清楚?
stripchart(y ~ g, pch=19)

也许也看看箱线图。较大的可变性掩盖了中位数的差异。
boxplot(y ~ g, col="skyblue2", horizontal=T)

现在看看 ANOVA 表。
anova(lm(y ~ g))
Analysis of Variance Table
Response: y
Df Sum Sq Mean Sq F value Pr(>F)
g 2 16.65 8.324 0.2472 0.7832
Residuals 21 707.07 33.670
残差(误差)线的平方和很大,所以均方很大。F 统计量是 MS(Group) 与 MS(Resid) 的比率。如此大的 MS(Error) 使 F 统计量变小,因此 P 值变大,导致结果不显着。
如果你有更多的数据,那么 DF 会更大,MS(Error) 更小,F 更大,P 值更小。
或者,如果组方差较小,则 MS(Error) 可能足够小以产生显着影响——即使在当前样本量下也是如此。
这是分布 F(2, 21) 的图。的观测值
显示为垂直虚线。P 值是密度曲线下虚线右侧的面积。F
