为什么n--√n在渐近正态性的定义中?

机器算法验证 估计 渐近的 效率
2022-01-31 07:08:36

估计器序列Un对于一个参数θ是渐近正态的,如果n(Unθ)N(0,v). 来源)然后我们调用v的渐近方差Un. 如果这个方差等于Cramer-Rao 界,我们说估计器/序列是渐近有效的。

问题:我们为什么使用n尤其?

我知道对于样本均值,Var(X¯)=σ2n所以这个选择使它正常化。但是既然上面的定义不仅仅适用于样本均值,为什么我们仍然选择归一化n.

2个回答

我们不能在这里选择“归一化”因子本质上是一个“方差稳定到有限的东西”因子,以便表达式不会随着样本量趋于无穷大而趋于零或趋于无穷大,而是保持分布在极限处。

所以它必须是在每种情况下它必须是什么。当然有趣的是,在许多情况下,它必须n. (但另请参阅下面@whuber 的评论)。

标准化因子必须为的标准示例 n, 而不是n是我们有模型的时候

yt=βyt1+ut,y0=0,t=1,...,T

ut白噪声,我们估计未知数β 通过普通最小二乘法。

如果发生这种情况,系数的真实值是|β|<1, 那么 OLS 估计量是一致的并且收敛于通常的n速度。

但如果相反,真正的价值是β=1(即我们实际上有一个纯粹的随机游走),那么 OLS 估计量是一致的,但会以“更快”的速度收敛n(这有时被称为“超一致”估计器 - 因为,我猜,这么多估计器以速率收敛n)。
在这种情况下,为了获得它的(非正态)渐近分布,我们必须缩放(β^β)经过n(如果我们仅按n表达式将变为零)。汉密尔顿第 17 章有详细信息。

您对样本均值方差的直觉是正确的。重新安排条件:

n(Unθ)N(0,v)
(Unθ)N(0,v)n
UnN(θ,vn)

最后一个等式是非正式的。然而,它在某种程度上更直观:你说的偏差Unθ变得更像正态分布时n增加。方差在缩小,但形状变得更接近正态分布。

在数学中,他们没有定义收敛到不断变化的右手边(n是变化的)。这就是为什么同样的想法被表达为你给出的原始条件。其中右手边是固定的,左手边会聚到它上面。