机器算法验证 - 为什么n--√n在渐近正态性的定义中？ - 吾爱随笔录

为什么n--√n在渐近正态性的定义中？

机器算法验证估计渐近的效率

2022-01-31 07:08:36

估计器序列 $U_n$ 对于一个参数 $\theta$ 是渐近正态的，如果 $\sqrt{n}(U_n - \theta) \to N(0,v)$ . （来源）然后我们调用 $v$ 的渐近方差 $U_n$ . 如果这个方差等于Cramer-Rao 界，我们说估计器/序列是渐近有效的。

问题：我们为什么使用 $\sqrt{n}$ 尤其？

我知道对于样本均值， $Var(\bar{X}) = \frac{\sigma^2}{n}$ 所以这个选择使它正常化。但是既然上面的定义不仅仅适用于样本均值，为什么我们仍然选择归一化 $\sqrt{n}$ .

2个回答

我们不能在这里选择。“归一化”因子本质上是一个“方差稳定到有限的东西”因子，以便表达式不会随着样本量趋于无穷大而趋于零或趋于无穷大，而是保持分布在极限处。

所以它必须是在每种情况下它必须是什么。当然有趣的是，在许多情况下，它必须是 $\sqrt n$ . （但另请参阅下面@whuber 的评论）。

标准化因子必须为的标准示例 $n$ ，而不是 $\sqrt n$ 是我们有模型的时候

y_{t} = β y_{t - 1} + u_{t}, y_{0} = 0, t = 1, . . ., T

$y_t = \beta y_{t-1} + u_t, \;\; y_0 = 0,\; t=1,...,T$

和 $u_t$ 白噪声，我们估计未知数 $\beta$ 通过普通最小二乘法。

如果发生这种情况，系数的真实值是 $|\beta|<1$ , 那么 OLS 估计量是一致的并且收敛于通常的 $\sqrt n$ 速度。

但如果相反，真正的价值是 $\beta=1$ （即我们实际上有一个纯粹的随机游走），那么 OLS 估计量是一致的，但会以“更快”的速度收敛 $n$ （这有时被称为“超一致”估计器 - 因为，我猜，这么多估计器以速率收敛 $\sqrt n$ ）。
在这种情况下，为了获得它的（非正态）渐近分布，我们必须缩放 $(\hat \beta - \beta)$ 经过 $n$ （如果我们仅按 $\sqrt n$ 表达式将变为零）。汉密尔顿第 17 章有详细信息。

您对样本均值方差的直觉是正确的。重新安排条件：

\sqrt{n} (U_{n} - θ) \to N (0, v)

$\sqrt{n}(U_n - \theta) \to N(0,v)$

(U_{n} - θ) \to \frac{N (0, v)}{\sqrt{n}}

$(U_n - \theta) \to \frac{N(0,v)}{\sqrt{n}}$

U_{n} \to N (θ, \frac{v}{n})

$U_n \to N(\theta,\frac{v}{n})$

最后一个等式是非正式的。然而，它在某种程度上更直观：你说的偏差 $U_n$ 从 $\theta$ 变得更像正态分布时 $n$ 增加。方差在缩小，但形状变得更接近正态分布。

在数学中，他们没有定义收敛到不断变化的右手边（ $n$ 是变化的）。这就是为什么同样的想法被表达为你给出的原始条件。其中右手边是固定的，左手边会聚到它上面。

其它你可能感兴趣的问题

上一篇为什么要使用观察到的 Fisher 信息？下一篇如何证明估计量是一致的？