为什么 AR(1) 系数的 OLS 估计有偏差?

机器算法验证 时间序列 最小二乘 偏见 自回归的 估计者
2022-02-09 17:32:43

我试图理解为什么 OLS 给出了 AR(1) 过程的有偏估计。考虑

yt=α+βyt1+ϵt,ϵtiidN(0,1).
在这个模型中,违反了严格的外生性,即ytϵt是相关的,但yt1ϵt是不相关的。但如果这是真的,那么为什么下面的简单推导不成立呢?
plim β^=Cov(yt,yt1)Var(yt1)=Cov(α+βyt1+ϵt,yt1)Var(yt1)=β+Cov(ϵt,yt1)Var(yt1)=β.

3个回答

正如评论中所讨论的那样,无偏性是一个有限样本属性,如果它成立,它将表示为

E(β^)=β

(其中期望值是有限样本分布的一阶矩)

而一致性是一个渐近属性,表示为

plimβ^=β

OP 表明,即使在这种情况下 OLS 是有偏见的,它仍然是一致的。

E(β^)βbutplimβ^=β

这里没有矛盾。

@Alecos 很好地解释了为什么正确的 plim 和 unbiasedbess 不一样。至于估计量不是无偏的根本原因,请回想一下,估计量的无偏性要求所有误差项都是独立于所有回归量值的均值,E(ϵ|X)=0.

在本例中,回归矩阵由值组成y1,,yT1,所以 - 见 mpiktas 的评论 - 条件转化为E(ϵs|y1,,yT1)=0对全部s=2,,T.

在这里,我们有

yt=βyt1+ϵt,
即使在假设下E(ϵtyt1)=0我们有
E(ϵtyt)=E(ϵt(βyt1+ϵt))=E(ϵt2)0.
但,yt也是 AR 模型中未来值的回归量,如yt+1=βyt+ϵt+1.

扩展两个好的答案。写下 OLS 估计量:

β^=β+t=2Tyt1εtt=2Tyt12

为了不偏不倚,我们需要

E[t=2Tyt1εtt=2Tyt12]=0.

但为此,我们需要E(εt|y1,...,yT1)=0,对于每个t. 对于 AR(1) 模型,这显然失败了,因为εt与未来值有关yt,yt+1,...,yT.