正态分布误差和中心极限定理

机器算法验证 自习 线性模型 计量经济学 正态假设 中心极限定理
2022-03-24 09:12:43

在 Wooldridge 的 Introductory Econometrics 中有一句话:

证明错误的正态分布的论据通常是这样的:因为是影响的许多不同的未观察到的因素的总和,我们可以调用中心极限定理来得出结论具有近似的正态分布。uyu

此引用与线性模型假设之一有关,即:

uN(μ,σ2)

其中u是总体模型中的误差项。

现在,据我所知,中心极限定理指出

Zi=(Yi¯μ)/(σ/n)

(其中Yi¯ 是从任何群体中抽取的随机样本的平均值,均值为μ,方差为σ2

接近标准正态变量的n

问题:

帮助我理解Zi的渐近正态性如何暗示uN(μ,σ2)

1个回答

这可以通过用 iid 随机变量的总和来表达 CLT 的结果来更好地理解。我们有

nX¯μσN(0,1)asymptotically

将商乘以\frac{\sigma}{\sqrt{n}}并使用Var(cX) = c^2 Var(X)σn的事实得到Var(cX)=c2Var(X)

X¯μN(0,σ2n)

现在将添加到 LHS 并使用的事实来获得μE[aX+μ]=aE[X]+μ

X¯=1ni=1nXiN(μ,σ2n)

最后,乘以并使用上述两个结果可以看到n

i=1nXiN(nμ,nσ2)

这与伍尔德里奇的声明有什么关系?好吧,如果误差是许多 iid 随机变量的总和,那么它将大致呈正态分布,如刚才所见。但是这里有一个问题,即未观察到的因素不一定是同分布的,它们甚至可能不是独立的!

尽管如此,在一些额外的规律性条件下,CLT 已成功扩展到独立的非同分布随机变量,甚至是轻度依赖的情况。这些本质上是保证总和中没有任何一项对渐近分布产生不成比例影响的条件,另请参见CLT 上的维基百科页面你当然不需要知道这些结果;Wooldridge 的目的仅仅是提供直觉。

希望这可以帮助。