为什么不在回归中直接使用工具变量作为协变量?

机器算法验证 回归 最小二乘 工具变量
2022-03-15 18:17:57

我知道这是一个愚蠢的问题,因为我知道工具变量和两阶段回归的理论。不过,我从未看到以下问题的明确答案:

  • 假设您由于与初始回归变量之一相关的未观察变量而具有内生性。纠正这种情况的典型方法是找到与未观察到的效应相关的工具变量,并使用两阶段回归方法。

现在我的问题是,为什么要经历这个麻烦——为什么不将工具变量作为标准回归量包含在初始估计中?

2个回答

工具变量回归的目的是提供对暴露因果影响的无偏估计X关于结果O, 当有一些不可测量的——可能是不可测量的——变量时U混淆之间的关系XO. 这是使用工具变量估计的最简单情况的 DAG(X,U, 和Z可以是变量集):

如果一个工具变量Z原因X, 对O除了通过X, 两者都没有先验原因ZO, 和效果XO是同质的,那么有足够大的样本E[O|X^]在哪里X^=E[X|Z]可以提供对因果关系的无偏估计XO.

总之你不关心效果ZO(除了通过X), 和E[O|X^]E[O|X,Z],所以简单地包括Z在您的模型中不会为您提供工具变量估计值。

最后评论:“……在最初的估计中?” 结束你的问题让我想澄清:一个初步估计X^(所以Z确实是该估计的一部分),并且一个用途X^作为第二次估计中的预测变量(无Z)。

你可以,人们也可以。正如@Alexis 指出的那样,它并没有给你一个完整的答案。

想象一下,您对内生变量的影响感兴趣XYZ是一种工具X. 在计量经济学中进行 IV 时:

  • 的回归XZ称为第一阶段回归。
  • 的回归YZ称为简化形式回归。

简化形式回归本身并不能估计XY.