审稿人显然试图将标准偏差用作某种临时统计测试,但这不起作用。审稿人尖刻的“除非我的统计数据让我失望”的评论因此很有趣(或者很疯狂,如果这会让你的论文被拒绝)。
具体来说,标准偏差告诉我们这些值在平均值周围的分布程度。然而,在大多数假设检验情况下,我们感兴趣的是确定每个组的均值以及这些均值是否不同。为此,我们需要确定我们知道每个组的平均值的准确程度,而这里的相关统计量是平均值的标准误差,而不是标准差。(这些是相关的,因为,其中是样本标准差,是样本数)。在检验中,分母通常是均值的标准误差(或类似的东西用于两样本 t 检验)。semean=sn√snt
很容易模拟数据,表明可以在标准差至少为 1 的组之间找到显着差异。例如,
a = rnorm(100, 0, 1) # Draws 100 random points from N(0,1)
b = rnorm(100, 1, 1) # Draws 100 random points from N(1,1)
t.test(a, b)
# Welch Two Sample t-test
#
# data: a and b
# t = -8.0116, df = 190.746, p-value = 1.097e-13
# alternative hypothesis: true difference in means is not equal to 0
# 95 percent confidence interval:
# -1.4188010 -0.8581969
# sample estimates:
# mean of x mean of y
# -0.1154137 1.0230852
类似地,您可以想象这样一种情况,其中平均值的每个标准误差都远大于 1,但检验发现显着差异。例如,假设均值是 -100 和 100:如果有足够的数据,即使标准差很大,我们也能够区分它们(例如,对于)tσ=30n=100
总而言之,审稿人在统计方面完全失败,这使得他/她的尖刻评论很有趣。