在 Wooldridge 的 Introductory Econometrics 中有一句话:
证明错误的正态分布的论据通常是这样的:因为是影响的许多不同的未观察到的因素的总和,我们可以调用中心极限定理来得出结论具有近似的正态分布。
此引用与线性模型假设之一有关,即:
其中是总体模型中的误差项。
现在,据我所知,中心极限定理指出
(其中 是从任何群体中抽取的随机样本的平均值,均值为,方差为)
接近标准正态变量的。
问题:
帮助我理解的渐近正态性如何暗示
在 Wooldridge 的 Introductory Econometrics 中有一句话:
证明错误的正态分布的论据通常是这样的:因为是影响的许多不同的未观察到的因素的总和,我们可以调用中心极限定理来得出结论具有近似的正态分布。
此引用与线性模型假设之一有关,即:
其中是总体模型中的误差项。
现在,据我所知,中心极限定理指出
(其中 是从任何群体中抽取的随机样本的平均值,均值为,方差为)
接近标准正态变量的。
问题:
帮助我理解的渐近正态性如何暗示
这可以通过用 iid 随机变量的总和来表达 CLT 的结果来更好地理解。我们有
将商乘以\frac{\sigma}{\sqrt{n}}并使用Var(cX) = c^2 Var(X)的事实得到
现在将添加到 LHS 并使用的事实来获得
最后,乘以并使用上述两个结果可以看到
这与伍尔德里奇的声明有什么关系?好吧,如果误差是许多 iid 随机变量的总和,那么它将大致呈正态分布,如刚才所见。但是这里有一个问题,即未观察到的因素不一定是同分布的,它们甚至可能不是独立的!
尽管如此,在一些额外的规律性条件下,CLT 已成功扩展到独立的非同分布随机变量,甚至是轻度依赖的情况。这些本质上是保证总和中没有任何一项对渐近分布产生不成比例影响的条件,另请参见CLT 上的维基百科页面。你当然不需要知道这些结果;Wooldridge 的目的仅仅是提供直觉。
希望这可以帮助。