在估计方差时,为什么无偏估计量除以 n-1 而最大似然估计除以 n?

机器算法验证 正态分布 方差 无偏估计器
2022-03-13 18:54:55

我完全感到困惑:一方面,您可以阅读各种解释,为什么必须除以 n-1 才能得到(未知)总体方差(自由度,未针对样本量 1 定义等)的无偏估计量。 ) - 参见例如这里这里

另一方面,当涉及到假设正态分布的方差估计时,所有这些似乎都不再正确了。据说方差的最大似然估计仅包括除以 n - 参见例如这里

现在,谁能告诉我为什么这里是真的,那里不是?我的意思是常态是大多数模型归结为的(尤其是由于CLT)。那么,选择“除以 n”到底是找到真实总体方差的最佳估计的最佳选择吗?!?

3个回答

您的问题的答案包含在您的问题中。

在为参数选择估算器时,您应该问自己,您希望估算器具有什么属性:

  • 鲁棒性
  • 不偏不倚
  • 具有 MLE 的分布特性
  • 一致性
  • 渐近正态
  • 您知道总体均值,但方差未知

如果您的估计量是除以 (n-1) 的估计量,那么您需要一个无偏的方差估计量。如果您的估算器是除以 n 的估算器,那么您有一个 MLE 估算器。当然,当n很大时;除以 (n-1) 或 n 将给您大致相同的结果,并且估计器将大致无偏并具有所有 MLE 估计器的属性。

MLE 确实是通过除以 n 找到的。但是,不能保证 MLE 是公正的。因此,使用无偏估计量(除以 n-1)这一事实并不矛盾。

在实践中,对于合理的样本量,无论如何它都不应该有很大的不同。

一个是无偏估计量

一个是最大似然估计

它们并不矛盾,只是服务于不同的目标

if you think about any distribution, the maximum point in the likelihood function is not necessarily the mean value