T 检验提供有关均值差异边际的信息?

机器算法验证 统计学意义 t检验 非参数
2022-03-22 10:03:06

我有 2 个未配对的数据集,其中样本均值的差异非常大(肉眼)。t 检验表明差异是显着的(p 值 = 0.007),我想知道我是否可以使用 t 检验来声称一个数据集提供的结果明显优于另一个数据集,或者我必须说t-tests 证明差异是显着的,并使用置信区间(或其他方法)来表明一个比另一个表现更好?

如果我们通过Wikipedia上对 T 检验的描述:“例如,可以使用 t 检验来确定两组数据的均值是否彼此显着不同”。基于此,我认为 t 检验只能用于显示均值是否不同,我们无法提取有关差异边际的信息,或者一个数据集优于另一个数据集。

3个回答

如果我可以使用 t 检验来声称一个数据集提供的结果明显好于另一个

我想指出,美国统计协会不鼓励使用“具有统计意义”这一表述。(但就个人而言,我并没有强烈反对它)

使用置信区间(或其他方法)来表明一个比另一个表现更好

置信区间可以解释为在给定假设的情况下与观测数据兼容的值范围。事实上,有人建议将它们重命名为兼容性间隔(请参阅“兼容性间隔”(格陵兰,2019)的解释是否普遍有效?以及其中的链接)。

所以在我看来,报告置信区间在你的情况下是合适的,我可以告诉你。

我还要注意,p 值和置信区间之间存在对偶性,因为 95% 置信区间是 p 值大于 0.05(或您选择确定区间的任何 alpha)的范围。因此,置信区间通常被认为是报告结果的 p 值的更具信息性的替代方案。

考虑下面两个独立的虚构正常数据集。

set.seed(910)
x1 = rnorm(100, 50, 7)
x2 = rnorm(90, 60, 8)

mean(x1)
[1] 49.86995
mean(x2)
[1] 60.04863

样本均值显示X¯1<X¯2建议μ1可能“显着”小于μ2.R 中的 Welch 两样本 t 检验表明,原假设H0:μ1=μ2被拒绝支持Ha:μ1<μ2.P值接近0. 更具体地说,单侧 CI:显示 95% 的置信度 μ1μ28.412.

t.test(x1, x2, alt="less")

        Welch Two Sample t-test

data:  x1 and x2
t = -9.5241, df = 187.95, p-value < 2.2e-16
alternative hypothesis: 
 true difference in means is less than 0
95 percent confidence interval:
      -Inf -8.412074
sample estimates:
mean of x mean of y 
 49.86995  60.04863 

这里没有什么是“证明”μ1<μ2.当然,因为我模拟了这些数据,我们知道 μ1μ2=10.然而,在真正的统计应用程序中,我们不会有如此准确的信息。我们能做的最好的就是报告样本意味着显示X¯1=49.87<X¯2=60.05 并说我们“有理由确定”μ1μ28.412.

如果原假设是t=0,那么这是测试这两种方法是否相同。但是你也可以测试t>a,然后测试边距是否大于某个数字。