主要讯息
- 您的假设与两组均值之间的差异有关。您提到的与实际组相关的置信区间意味着它们本身。
- 您可能想要估计和报告组均值之间差异的置信区间,而不是组均值的置信区间。
- 当组均值之差的 95% 置信区间不包括零时,您的 p 值也应小于 0.05(尽管如果您使用标准 t 检验进行显着性检验并使用自举法进行显着性检验,则可能会出现例外情况置信区间)。因此,您讨论的单个组均值的重叠置信区间和显着性检验之间的紧张关系将得到解决。
R 示例
这是一个小 R 模拟来演示这个想法。
首先让我们为两组创建一些数据,每组 n=100,取自群体之间的平均差异为 d=.35
> set.seed(4444)
> n <- 100
> g1 <- rnorm(n, mean = 0, sd = 1)
> g2 <- rnorm(n, mean = 0.35, sd = 1)
我们可以快速查看组均值和组均值之间的差异。
> # Group means
> round(mean(g1), 2)
[1] 0.11
> round(mean(g2), 2)
[1] 0.46
> round(mean(g2) - mean(g1), 2)
[1] 0.35
然后,我们可以查看各个组均值的置信区间。
> round(as.numeric(t.test(g1, conf.level=.95)$conf.int), 2)
[1] -0.10 0.31
> round(as.numeric(t.test(g2, conf.level=.95)$conf.int), 2)
[1] 0.26 0.66
查看组均值如何具有重叠的置信区间(即 0.31 大于 0.26)。但是,我们可以查看感兴趣的置信区间;即组均值之差的置信区间。
> round(as.numeric(t.test(g2, g1, conf.level=.95)$conf.int), 2)
[1] 0.07 0.64
它不包括零。
我们现在可以在 t 检验中查看组均值之间的差异,并看到 p 值小于 0.05,这与组均值之间差异的置信区间一致。
> t.test(g2, g1)
Welch Two Sample t-test
data: g2 and g1
t = 2.4506, df = 197.308, p-value = 0.01513
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
0.06897783 0.63745786
sample estimates:
mean of x mean of y
0.4588689 0.1056511