机器算法验证 - 为什么自相关会影响 OLS 系数标准误？ - 吾爱随笔录

为什么自相关会影响 OLS 系数标准误？

机器算法验证回归标准错误自相关

2022-03-13 15:54:25

似乎OLS 残差自相关并不总是一个问题，具体取决于手头的问题。但是为什么残差自相关会影响系数标准误呢？来自关于自相关的维基百科文章：

虽然它不偏向 OLS 系数估计，但当低滞后误差的自相关为正时，标准误差往往被低估（并且 t 分数被高估）。

2个回答

假设您的 OLS 回归已明确指定并包含所有正确的解释变量，但您有未指定的残差相关结构：

y_{t} = x_{t}^{'} β + ϵ_{t}, V [ϵ] = Ω

$y_t = x_t' \beta + \epsilon_t, \mathbb{V}[\mathbf{\epsilon}]=\Omega$ OLS 估计为

\hat{β} = (X^{'} X)^{- 1} X^{'} Y = β + (X^{'} X)^{- 1} X^{'} ϵ

$\hat\beta = (X'X)^{-1} X'Y = \beta + (X'X)^{-1} X'\mathbf{\epsilon}$ 他们的方差是

V [\hat{β}] = E [(X^{'} X)^{- 1} X^{'} ϵ ϵ^{'} X (X^{'} X)^{- 1}]

$\mathbb{V}[\hat\beta] = \mathbb{E} [ (X'X)^{-1} X'\mathbf{\epsilon}\mathbf{\epsilon}'X (X'X)^{-1} ]$ 通常，在这个阶段，我们必须假设存在概率极限

\frac{1}{T} (X^{'} X) \to Σ

$\frac1T (X'X) \to \Sigma$ ，以便

T V [\hat{β}] \to Σ^{- 1} p l i m [\frac{1}{T} X^{'} ϵ ϵ^{'} X] Σ^{- 1} = Σ^{- 1} p l i m [\frac{1}{T} X^{'} Ω X] Σ^{- 1}

$T \mathbb{V}[\hat\beta] \to \Sigma^{-1} {\rm plim} \bigl[ \frac1T X'\mathbf{\epsilon}\mathbf{\epsilon}'X \bigr] \Sigma^{-1} = \Sigma^{-1} {\rm plim} \bigl[ \frac1T X'\Omega X \bigr] \Sigma^{-1}$ 这个表达式与朴素的 OLS 标准错误产生的不同，因此通常 OLS 标准错误是错误的。

当然，如果 $X$ 可以认为是固定的，则不需要渐近近似，并且 $X$ 可以通过期望进行，因此

V [\hat{β}] = (X^{'} X)^{- 1} X^{'} Ω X (X^{'} X)^{- 1}

$\mathbb{V}[\hat\beta] = (X'X)^{-1} X'\Omega X (X'X)^{-1}$ 达到同样的效果。

自相关（外生性）：如果 t1 中残差的观察依赖于 t0 中残差的观察，那么它基本上违反了OLS 的基本假设，即“误差项独立分布且不相关”。这会使 OLS 项的 Beta 系数的估计产生偏差。

当在残差中观察到这种趋势时，回归模型的残差会吸收那些影响不属于回归方程的因变量的变量的影响。

排除变量的持久性在大多数情况下是自相关的原因。这在时间序列数据中更为普遍。

这可以通过使用一些转换技术来缓解，例如，

巴黎温斯顿数据转换
区分因变量
区分所有变量

一种更简单的方法是，

使用 OLS 估计线性模型。
计算残差。
回归所有自变量和滞后变量的残差。
使用t检验，如果滞后残差系数显着，我们可以拒绝独立误差的零。

检测自动相关性的测试： **

德宾-沃森
布鲁施 - 戈弗雷

如果解释变量是随机的，例如当它们被错误地测量或是内生的，则此假设/问题被违反/豁免。

其它你可能感兴趣的问题

上一篇说明随机变量 X 和 Y 是独立的正确符号是什么？下一篇为什么在克里金法时必须提供变异函数模型？