在估计总体均值时,样本均值的一半风险如何低于样本均值本身?

机器算法验证 估计 意思是 正则化 斯坦斯现象
2022-03-25 02:02:40

我昨天感兴趣地阅读了Efron 和 Morris (1977) Stein's Paradox in Statistics并偶然发现了这样的陈述,即当且仅当总体均值接近于零时,使用一半样本的风险(均方误差,MSE)均值作为总体均值的估计值低于使用均值的估计值。

我试图对此进行建模(不幸的是,在 Crystal Ball / Excel 中,没有为此使用 R)但无法复制此结果。在我的示例中,平均估计值的一半的风险(根据 MSE)变得更接近平均估计值,但从未变低。显然,我可能误解了这个概念,但如果有人可以向我展示/进一步解释这一点,我会非常感兴趣。

1个回答

您实际上并不需要模拟来了解这是如何发生的:@whuber 的评论基本上指出了这一点。

想象人口由N(1,10)描述,即人口均值是μ=1和标准差是σ=10让您的样本量为n=10样本均值 (MSE) 的方差将在\sigma^2/n=10左右,因此您将获得与真实均值\mu=1σ2/n=10相差甚远的样本均值值取样本均值的一半,将使方差减少四倍,使估计更接近零,因此更接近\mu=1μ=1μ=1