N 增加时缩小的变异性是样本均值的变异性,通常表示为标准误差。或者,换句话说,样本均值准确性的确定性正在增加。
想象一下,您进行一个实验,收集 3 名男性和 3 名女性并测量他们的身高。你有多确定每组的平均身高是不同男性和女性人群的真实平均值?我应该认为你根本不会很确定。您可以轻松地收集 3 个新样本并找到距离第一个样本几英寸的新平均值。很多这样的重复实验甚至可能导致女性比男性高,因为平均值差异很大。使用低 N 时,您无法确定样本的平均值,并且样本之间的平均值差异很大。
现在想象每组有 10,000 个观察值。很难找到 10,000 个新样本,这些样本的平均值相差很大。它们的可变性要小得多,您会更加确定它们的准确性。
如果您可以接受这种思路,那么我们可以将其作为标准误差插入到您的统计计算中。从它的方程可以看出,它是一个参数的估计,(随着 n 的增加应该变得更准确)除以一个总是随着 n 增加的值。该标准误差表示计算中的手段或效果的可变性。它越小,您的统计测试就越强大。σn−−√
这是 R 中的一个小模拟,以演示标准误差与初始实验的许多次重复的平均值的标准差之间的关系。在这种情况下,我们将从总体平均值 100 和标准差 15 开始。
mu <- 100
s <- 50
n <- 5
nsim <- 10000 # number of simulations
# theoretical standard error
s / sqrt(n)
# simulation of experiment and the standard deviations of their means
y <- replicate( nsim, mean( rnorm(n, mu, s) ) )
sd(y)
请注意最终标准偏差如何接近理论标准误差。通过在此处使用 n 变量,您可以看到随着 n 的增加,可变性度量将变得更小。
[顺便说一句,图中的峰度并没有真正改变(假设它们是正态分布)。降低方差不会改变峰度,但分布看起来会更窄。目视检查峰态变化的唯一方法是将分布置于相同的尺度上。]