为什么统计学家证明渐近正态性?

机器算法验证 正态假设 渐近的
2022-03-31 16:46:56

在许多统计论文中,作者提出了一种新的数据分析方法,并证明了它的特性,例如一致性或渐近正态性。我认为这是一种传统或习俗。我知道一致性很重要,但我不明白为什么渐近正态性如此重要。

这是大样本财产。(写为“大”,读为“无限”)在实际数据分析中,我们永远不会有无限样本。尽管估计量是渐近正态的,但它在实际样本量中的分布可能与正态分布相去甚远。

2个回答

例如,这样做是有用的,以便能够量化估计器的采样不确定性或测试的零分布。

回想一下,正常随机变量在区间中实现了 95% 的实现。因此,如果您可以证明(通常是缩放版本)估计量是渐近正态的,那么您知道它至少在大样本中表现正常,因此您可以轻松构建置信区间。μ±1.96σ

近似值是否对(在实践中总是如此)您的样本是有限的设置有用,不幸的是,实际上在分析上确实不知道 - 如果可以通过分析得出有限样本分布,这就是我们将使用的。不幸的是,这仅在极少数情况下有效(例如,当从正态分布中抽样时,t 统计量遵循分布)。

通常,然后使用模拟来至少了解近似在相关情况下的有用性。

知道随机变量的分布就是知道关于它的一切。估计量是随机变量,因为它们是随机样本的函数。因此,建立度量的概率分布不仅是一种传统,而且是统计分析的最终目标。通常,估计量的小样本属性很难确定,在这些情况下,渐近属性是次优的。因此,这与正态性无关,而是变量的渐近分布。如果是正常的,那就更好了。由于 CLT 和大数定律,在许多情况下,渐近分布最终是正态的。