标准错误是如何工作的?

机器算法验证 标准错误
2022-02-15 22:14:04

我最近一直在研究标准错误的内部工作原理,我发现自己无法理解它是如何工作的。我对标准误差的理解是,它是样本均值分布的标准差。我的问题是:

• 当我们通常只取一个样本时,我们如何知道标准误差是样本均值的标准差?

• 为什么计算标准误差的方程不反映单个样本的标准偏差方程?

3个回答

假设是独立同分布的。这就是我很确定你所指的情况。让它们的共同平均值为并且它们的共同方差为X1,X2,,Xnμσ2

现在样本均值是期望的线性表明的平均值也是独立性假设意味着的方差其项的方差之和。每个这样的项 都有方差 (因为常数乘以随机变量的方差是常数的平方乘以随机变量的方差)。我们有相同分布的这些变量来求和,所以每个项都有相同的方差。结果,对于样本均值的方差,我们得到Xb=iXi/nXbμXbXi/nσ2/n2nnσ2/n2=σ2/n

通常我们不知道,所以我们必须从数据中估计它。根据设置,有多种方法可以做到这一点。的两个最常见的通用估计样本方差和它的小倍数,(这是的无偏估计量)。在上一段中使用其中任何一个代替并取平方根会给出形式的标准误差。σ2σ2 s2=1ni(XiXb)2su2=nn1s2σ2σ2s/nsu/n

是的,平均值的标准误差 (SEM) 是平均值的标准偏差 (SD)。(标准误差是抽样分布 SD 的另一种说法。在这种情况下,抽样分布是固定大小样本的平均值,例如 N。)SEM 和总体 SD 之间存在数学关系:SEM = 总体SD / N 的平方根。这种数学关系非常有用,因为我们几乎从来没有直接估计 SEM,但我们确实估计了总体 SD(即我们样本的 SD)。至于你的第二个问题,如果你要收集多个大小为 N 的样本并计算每个样本的平均值,你可以简单地通过计算平均值的 SD 来估计 SEM。所以 SEM 的公式确实反映了单个样本的 SD 公式。

两个@JoelW +1。&@MichaelChernick。我想为@JoelW. 的答案添加一个细节。他指出,“我们几乎从未对 SEM 进行过直接估计”,这基本上是正确的,但值得明确承认该声明的一个警告。具体来说,当一项研究比较多个组/治疗(例如,安慰剂与标准药物与新药)时,通常使用方差分析来查看它们是否都相等。原假设是每个组都来自同一个总体,因此,所有三个均值都是总体均值的估计值。也就是说,标准 ANOVA 中的零假设假设您确实对 SEM 有直接估计。考虑均值抽样分布的方差方程:

σx¯2=σpop2nj,
其中是总体方差,是组数。虽然我们通常不以这种方式进行计算,但我们可以简单地使用标准公式插入估计值,并通过最小的代数改组,形成统计量,如下所示: 在这种情况下,我们真的会使用标准公式(仅应用于组均值),即: 是组均值的均值。 σpop2njF
F=nj×sx¯2spooled within group2
sx¯2=j=1nj(x¯jx¯.)2nj1,
x.

因为我们通常认为零假设不正确,@JoelW. 的观点是正确的,但我坚持这一点,因为我认为它提供的清晰度有助于理解这些问题。