对于那些不熟悉来自 Stata 的以下代码片段的人,OP 提供
ivreg my_dv var1 var2 var3 (L.my_dv = D2.my_dv D3.my_dv D4.my_dv)
这个方程可以读为
Yt=α+β1(Var1)+β2(Var1)+β3(Var1)+β4(Y~t−1)
其中估计为Y~t−1
Y~t−1=α+Z1(Δ2Yt)+Z2(Δ3Yt)+Z3(Δ4Yt)
(即IV方程的第一阶段在Stata代码的括号内)
增量代表二阶、三阶和四阶差异,它们被用作排除工具来估计因变量的滞后。
在 Stata 代码中,L.
表示该变量滞后,并表示该变量的一阶差分,因此表示二阶差分。t−1D.
D2.
起初我想不出任何合乎逻辑的理由为什么有人会这样做。但是 Kwak 指出(参考这篇论文),Arellano-Bond 方法使用差异作为工具来估计模型的自回归分量。(最初我还假设,只有在序列是非平稳的情况下,差异才会产生影响,邦德在链接的论文中指出,在序列是随机游走的情况下,差异只会是弱工具,第 21 页)
作为工具变量介绍的进一步阅读材料的建议,
此回复中的另一张海报(查理)链接到他准备的一些幻灯片,我喜欢并建议值得研究工具变量的介绍。我还建议我的一位教授为研讨会准备的这个powerpoint作为介绍。作为对任何想要了解更多有关工具变量的人的最后建议,您应该查看 Joshua Angrist 的工作。
这是我的初步回答
虽然我同意 Kwak 和 ars 所说的一切,但我仍然想不出为什么有人会使用因变量的差异作为工具来估计因变量的滞后(如果人们不知道 Stata 代码,L.
表示滞后该变量,并表示该变量的一阶差分,因此表示二阶差分)。t−1D.
D2.
在我见过的所有应用程序中,人们使用自变量的滞后作为工具来估计因变量的滞后(原因 ars 谈到)。但这是基于这样的假设,即滞后自变量在应用它们的时间段内对误差项是外生的。
我不知道因变量的差异被认为是外生的任何推理。据我所知,仅区分等式的一侧是不被接受的做法,并且会产生相当不合逻辑的结果(这是一篇批评某人关于相反情况的论文,其中他们将变量级别作为预测变量一个不同的系列。)如果您重新排列 IV 方程中的项,它实际上看起来类似于增强的 Dickey Fuller 检验。
虽然最简单的答案是询问编写代码的人,但任何人都可以举一个这个过程可以接受的例子,或者这个过程会返回一些有意义的结果的任何情况吗?我想不出任何逻辑推理为什么差异会对水平产生影响,除非系列是非平稳的。