所以只是“为什么”是?应该如何解释/阐明在分母为什么我们将样本均值除以样本量的平方根,直观地说?以及如何/为什么将其称为标准“错误”。(问题同样适用于总体的真实标准差:)
是否有一个直观的推导可以说明这一点?
请假设您正在向一个了解平均值和样本量的 6 岁儿童解释它:)
所以只是“为什么”是?应该如何解释/阐明在分母为什么我们将样本均值除以样本量的平方根,直观地说?以及如何/为什么将其称为标准“错误”。(问题同样适用于总体的真实标准差:)
是否有一个直观的推导可以说明这一点?
请假设您正在向一个了解平均值和样本量的 6 岁儿童解释它:)
这是因为并且对于常数,。
由于我们假设单个观测值是独立的,项为,并且由于我们假设观测值是同分布的,所有方差都是。所以
当我们取其平方根时(因为在方差尺度上更难思考),我们得到。
更直观地,想想 2 个统计课:首先,老师分配每个学生从一组带有数字的图块中抽取一个大小为 10 的样本(老师知道这个总体的真实平均值,但学生不知道't) 并计算其样本的平均值。第二位老师分配他/她的每个学生从同一组瓷砖中抽取大小为 100 的样本并计算平均值。您是否希望每个样本均值与总体均值完全匹配?或有所不同?您是否期望样本均值的分布在两个类别中相同?还是二等舱往往更接近人口?这就是为什么除以样本量的函数是有意义的。平方根意味着我们有一个收益递减规律,要将样本量增加四倍所需的标准误差减半。
至于名称,全称是“x-bar的抽样分布的估计标准差”;只需要说几次,您就会喜欢使用缩短的表格。我不知道是谁首先用这种方式用“错误”代替了“偏差”,但它卡住了。标准差衡量个体观察的变异性;标准误差衡量参数估计的可变性(基于观察)。
为什么是√n?
因此,有一个称为中心极限定理的理论告诉我们,随着样本量的增加,均值的抽样分布变得正态分布,而与父分布无关。换句话说,给定足够大的样本量,来自总体的所有样本的平均值将与总体平均值相同。我们知道这确实发生了。让我们把它放在银行里,稍后再重新审视它。
现在,让我们看看当我们有一个小样本量(n = 5)时会发生什么,然后观察如果我们增加样本量并保持所有总体参数相同会发生什么。
总体平均值:15 标准差:5 N=5
在上述情况下,我们的均值标准误 (SEM) 将为:5/√5 = 2.236
现在让我们考虑一个样本大小为 10 的案例
总体平均值:15 标准差:5 N=10
SEM 将为:5/√10 = 1.158
将样本增加到 100:SEM = 5/√100 = .5
将样本增加到 1000:SEM = 5/√1000 = .158
......你看到了模式。随着样本量的增加,均值的标准误差会减小,并且随着您的样本量无限增加,将继续接近零。为什么是这样?一种思考方式是,如果您不断增加样本量,您最终将对整个总体进行抽样,此时,您的样本均值就是总体均值。也就是说,任何给定的样本均值可能不会完全等于真实的总体均值,但是随着您的样本量向整个总体的大小增加,给定的样本均值可能偏离的量(标准误差) 变得越来越小。
现在,让我们回到均值标准误的概念定义。一种看待它的方法是“样本均值的标准差”,或者,“平均而言,大小为 N 的样本将偏离总体均值这个数量”。因此,您的 SEM 统计数据让您了解样本均值与总体均值的近似程度。
所以我们知道 SEM 告诉我们大小为 N 的样本均值与总体均值的接近程度,而且我们还知道,随着样本量的增加,任何给定的样本均值将更接近总体均值。
这两个想法的数学表达就是SEM的公式
通过除以 N 的平方根,您为使用样本而不是整个总体付出了“惩罚”(抽样使我们能够对总体进行猜测或推论。样本越小,您可能的信心就越低有这些推论;这就是“惩罚”的由来)。当您的样本非常小时,该惩罚相对较大。然而,随着样本量的增加,这种惩罚会迅速减少,无限接近样本与总体本身相等的点。
随着样本量的增加,样本均值与总体均值接近等价的速度有多快(即 SEM 接近 0 的速度有多快)?这将取决于公式中的分子:标准偏差。标准差是衡量任何给定观察值在总体中的可预测性,或者任何一个观察值可能与平均值相差多远的量度。可预测性越低,标准差就越高。同样,标准差越高,随着样本量 N 的增加,样本均值接近总体均值的速度就越慢。然而,中心极限定理的功效告诉我们,随着样本量变得非常大,SEM 变得非常小,而与标准偏差无关。也就是说,具有足够大的样本量将导致非常小的 SEM 在几乎所有情况下。大标准差或小标准差之间的这种趋势的主要差异在样本量较小时最为显着——如果从一个具有很大变异性的总体中获得小样本,您会付出很大的代价!