线性回归中的滞后因变量

机器算法验证 回归 时间序列 最小二乘 自回归的
2022-03-20 15:49:19

最近我读到一篇论文,其中在时间序列中数据是根据方程 此处使用 OLS(使用R 中的命令)来获取的系数。它在统计上是正确的吗?

Yt=β1Yt1+β2X+ε.
lm()Yt1

我理解当我们处理时间序列数据时,这实际上意味着一个 ARX 过程,可以表示为 其中来自 Yule-Walker 方程。

Yt=θYt1+βX+ε,
θ

产生相同的结果吗?OLS 估计器不会像那样遭受自相关问题吗?我的统计知识是初级水平。请指导我理解这一点。θβ1E[xtεt]0

2个回答

嗨:您的模型也称为 koyck 分布滞后,使用小样本可能难以估计。对于更大的样本,我的经验是偏差没有问题。(我用模拟来检查这个)。

该链接在第 12 页和第 13 页简要讨论了估计的统计属性。基本上,它的问题类似于 AR(1) 的估计。

https://www.reed.edu/economics/parker/312/tschapters/S13_Ch_3.pdf

我会查看 hamilton 或 little koyck book (1954) 进行更深入的讨论,但希望以上内容对一些人有所帮助。

根据我的阅读,Yule-Walker 方程使用最小二乘法来估计 AR-1 滞后系数(您在显示 1 中称为\)。系数的联合估计是使用最小二乘模型正确完成的,该模型调整了您编写的模型中如果模型由于交叉滞后、遗漏变量或更高的滞后阶而被错误指定,并且显示 1 没有描述数据生成过程,则系数可能会出现很大偏差。β1θXX