为什么自相关会影响 OLS 系数标准误?

机器算法验证 回归 标准错误 自相关
2022-03-13 15:54:25

似乎OLS 残差自相关并不总是一个问题,具体取决于手头的问题。但是为什么残差自相关会影响系数标准误呢?来自关于自相关的维基百科文章

虽然它不偏向 OLS 系数估计,但当低滞后误差的自相关为正时,标准误差往往被低估(并且 t 分数被高估)。

2个回答

假设您的 OLS 回归已明确指定并包含所有正确的解释变量,但您有未指定的残差相关结构:

yt=xtβ+ϵt,V[ϵ]=Ω
OLS 估计为
β^=(XX)1XY=β+(XX)1Xϵ
他们的方差是
V[β^]=E[(XX)1XϵϵX(XX)1]
通常,在这个阶段,我们必须假设存在概率极限1T(XX)Σ, 以便
TV[β^]Σ1plim[1TXϵϵX]Σ1=Σ1plim[1TXΩX]Σ1
这个表达式与朴素的 OLS 标准错误产生的不同,因此通常 OLS 标准错误是错误的。

当然,如果X可以认为是固定的,则不需要渐近近似,并且X可以通过期望进行,因此

V[β^]=(XX)1XΩX(XX)1
达到同样的效果。

自相关(外生性):如果 t1 中残差的观察依赖于 t0 中残差的观察,那么它基本上违反了OLS 的基本假设,“误差项独立分布且不相关”这会使 OLS 项的 Beta 系数的估计产生偏差。

当在残差中观察到这种趋势时,回归模型的残差会吸收那些影响不属于回归方程的因变量的变量的影响

排除变量的持久性在大多数情况下是自相关的原因。这在时间序列数据中更为普遍。

这可以通过使用一些转换技术来缓解,例如,

  1. 巴黎温斯顿数据转换
  2. 区分因变量
  3. 区分所有变量

一种更简单的方法是,

  1. 使用 OLS 估计线性模型。
  2. 计算残差。
  3. 回归所有自变量和滞后变量的残差。
  4. 使用t检验,如果滞后残差系数显着,我们可以拒绝独立误差的零。

检测自动相关性的测试: **

  1. 德宾-沃森
  2. 布鲁施 - 戈弗雷

如果解释变量是随机的,例如当它们被错误地测量或是内生的,则此假设/问题被违反/豁免。