给定一个随机变量具有明确的期望值, 是样本集的平均值, 我们称之为, 总是一个无偏估计量? 换句话说,是否总是这样:
此外,将始终保持一致,即方差会随着样本数减少增加?
给定一个随机变量具有明确的期望值, 是样本集的平均值, 我们称之为, 总是一个无偏估计量? 换句话说,是否总是这样:
此外,将始终保持一致,即方差会随着样本数减少增加?
在评论中回答:使用期望的线性立即回答第一个问题。第二个结论仅在基础分布具有有限方差时才成立,在这种情况下,它遵循简单的方差计算。– 呼呼
第二个结论甚至在没有假设有限方差的情况下得出,因为你假设了平均值存在。强大的大数定律然后给出结果,它可以在不假设有限方差的情况下被证明。
一种情况可能是有偏估计: 样本不是从感兴趣的总体中均匀随机抽样的。这确实是两个问题:
(1) 总体中的某些值比其他值更有可能被抽样。一个典型的例子是当我们查看自愿民意调查时。似乎很有可能意见强烈的人比漠不关心的人更有可能完成调查。
(2) 我们有样本,但它们不是来自感兴趣的人群。这在某种程度上似乎是一种逃避,但在实践中这是非常普遍的。例如,当我们在选举前查看民意调查时,感兴趣的人群是选举之夜的实际投票。显然,在选举之前不可能获得任何这些样本,因此我们查看具有我们假设/希望分布接近我们关心的真实分布并且可以抽样的人口:选举前进行的民意调查。 ..然后我们也希望从中得到一个统一的随机样本人口,或者我们使用方法来尝试重新平衡由于各种群体的过度/不足代表而导致的估计量。我们也可能会尝试随着时间的推移调整人群意见的潜在变化,以解释我们没有来自感兴趣人群的样本这一事实,但可能能够模拟感兴趣人群和我们可以抽样的人群。
我怀疑这可能不是您正在寻找的答案类型:即,我认为 OP 可能对这种情况感到好奇从正确的分布中均匀抽样,但估计量可能不一致(如前所述,如果方差未定义,可能会发生这种情况)。我提出了这个答案,因为我认为它在实践中是一个更常见的问题,并且在应用分析期间通常应该更仔细地考虑。