样本均值是否总是期望值的无偏估计?

机器算法验证 随机变量 期望值 偏见 无偏估计器 一致性
2022-03-22 06:18:08

给定一个随机变量x具有明确的期望值μ, 是样本集的平均值{x1, , xn}, 我们称之为μ^, 总是一个无偏估计量μ? 换句话说,是否总是这样:

E[μ^]=E[i=1nxin]=μ=E[x].
不管具体情况x?

此外,将μ^始终保持一致,即方差V[μ^]会随着样本数减少n增加?

2个回答

在评论中回答:使用期望的线性立即回答第一个问题。第二个结论仅在基础分布具有有限方差时才成立,在这种情况下,它遵循简单的方差计算。– 呼呼

第二个结论甚至在没有假设有限方差的情况下得出,因为你假设了平均值μ存在。强大的大数定律然后给出结果,它可以在不假设有限方差的情况下被证明。

一种情况μ^可能是有偏估计μ: 样本x1,...,xn不是从感兴趣的总体均匀随机抽样的。这确实是两个问题:

(1) 总体中的某些值比其他值更有可能被抽样。一个典型的例子是当我们查看自愿民意调查时。似乎很有可能意见强烈的人比漠不关心的人更有可能完成调查。

(2) 我们有样本,但它们不是来自感兴趣的人群。这在某种程度上似乎是一种逃避,但在实践中这是非常普遍的。例如,当我们在选举前查看民意调查时,感兴趣的人群是选举之夜的实际投票。显然,在选举之前不可能获得任何这些样本,因此我们查看具有我们假设/希望分布接近我们关心的真实分布并且可以抽样的人口:选举前进行的民意调查。 ..然后我们也希望从中得到一个统一的随机样本人口,或者我们使用方法来尝试重新平衡由于各种群体的过度/不足代表而导致的估计量。我们也可能会尝试随着时间的推移调整人群意见的潜在变化,以解释我们没有来自感兴趣人群的样本这一事实,但可能能够模拟感兴趣人群和我们可以抽样的人群。

我怀疑这可能不是您正在寻找的答案类型:即,我认为 OP 可能对这种情况感到好奇xi从正确的分布中均匀抽样,但估计量可能不一致(如前所述,如果方差未定义,可能会发生这种情况)。我提出了这个答案,因为我认为它在实践中是一个更常见的问题,并且在应用分析期间通常应该更仔细地考虑。