一致的估计量和无偏的估计量有什么区别?
这些术语的精确技术定义相当复杂,很难直观地理解它们的含义。我可以想象一个好的估算器和一个坏的估算器,但我无法看到任何估算器如何满足一个条件而不是另一个条件。
一致的估计量和无偏的估计量有什么区别?
这些术语的精确技术定义相当复杂,很难直观地理解它们的含义。我可以想象一个好的估算器和一个坏的估算器,但我无法看到任何估算器如何满足一个条件而不是另一个条件。
在不使用太多技术语言的情况下定义这两个术语:
如果随着样本量的增加,估计(由估计器产生)“收敛”到被估计参数的真实值,则估计器是一致的。更准确地说,一致性意味着,随着样本量的增加,估计量的抽样分布越来越集中在真实参数值上。
如果平均而言,估计量达到真实参数值,则估计量是无偏的。也就是说,估计器的采样分布的均值等于真实的参数值。
两者不等价:无偏性是关于估计量的抽样分布的期望值的陈述。一致性是关于随着样本量的增加而“估计量的抽样分布将走向何方”的陈述。
当然有可能满足一个条件,但不能满足另一个条件——我将举两个例子。对于这两个示例,请考虑来自总体
估计量的一致性意味着随着样本量变大,估计值越来越接近参数的真实值。无偏性是一种有限样本属性,不受增加样本量的影响。如果估计值等于真实参数值,则估计值是无偏的。这对于所有样本大小都是正确的并且是精确的,而一致性是渐近的并且只是近似相等而不是精确的。
说一个估计器是无偏的,意味着如果你抽取了许多大小为的样本并每次计算估计值,所有这些估计值的平均值将接近真实参数值,并且随着你这样做的次数增加而越来越接近. 样本均值既一致又无偏。标准差的样本估计值有偏差但一致。
在与@cardinal 和@Macro 的评论中讨论后更新:如下所述,显然存在一些病态的情况,即方差不必为 0 以使估计量保持强一致,而且偏差甚至不必为0个。
的样本并计算估计量与真实参数之间的差异,这将为每个提供一个随机变量。如果我们将这些随机变量的序列作为趋于无穷大,均值和方差都趋于零。无偏意味着特定的这个随机变量的均值为零。
因此,一个区别是偏差是特定的属性,而一致性是指当趋于无穷大时的行为。因为另一个区别是偏差只与均值有关(无偏估计量可能大错特错,只要误差平均抵消),而一致性也说明了方差。
如果方差不为零,则估计量可以对所有的偏差不为零但趋于零,则估计量可以对所有 n 一致但偏。例如,如果偏差为,则偏差将为零,但它永远不会等于零;一个序列可以有一个实际上并不相等的限制。