工具变量如何解决选择偏差?

机器算法验证 回归 计量经济学 偏见 因果关系 工具变量
2022-03-10 04:16:41

我想知道工具变量如何解决回归中的选择偏差。

这是我正在咀嚼的例子:在Mostly Harmless Econometrics中,作者讨论了与服兵役和晚年收入有关的 IV 回归。问题是,“在军队服役会增加还是减少未来的收入?” 他们在越南战争的背景下调查了这个问题。我知道兵役不能随机分配,这是因果推理的问题。

为了解决这个问题,研究人员使用征兵资格(如“你的征兵编号被称为”)作为实际服兵役的工具。这是有道理的:越南征兵将年轻的美国男性随机分配到军队中(理论上——这些应征者是否实际服役涉及到我的问题)。我们的另一个 IV 条件似乎很可靠:征兵资格和实际兵役是强正相关的。

这是我的问题。看起来你会得到自我选择的偏见:也许更富有的孩子可以退出在越南服役,即使他们的选秀号码被告知。(如果事实并非如此,为了我的问题,让我们假装)。如果这种自我选择在我们的样本中产生了系统性偏差,那么我们的工具变量如何解决这种偏差?我们是否必须将我们的推断范围缩小到“无法逃脱选秀的那类人”?或者 IV 是否以某种方式挽救了我们推理的那一部分?如果有人能解释这是如何工作的,我将不胜感激。

1个回答

实际上,选择偏差问题是使用工具的最初动机。这里的问题是随机选秀彩票是否能解决这个问题。你问的完全正确:这个仪器的局限性是什么?如果确实有钱的孩子有更好的机会避免选秀,那么服务对以后收入的负面影响绝对会被高估。

草案还有其他方法,例如由于健康状况不佳。或者,相反,潜在的应征者都知道,志愿服务而不是被抽签选中会带来更好的安置和服务条件。因此,彩票号码更有可能被选中的人通常会选择志愿服务。如果这种回避行为以您描述的方式破坏了随机化过程,那么我们的 2SLS 估计仍然会有偏差。在这种情况下,将样本范围缩小到那些没有逃脱草案的人对您没有帮助,因为再次随机化处理实际上并不是随机的。
但是,如果不遵守治疗的情况仍然是随机的或平均而言不显着,那么彩票号码仍然可以用作工具。在这种情况下,您的兵役工具是意向治疗(ITT,请参阅 Angrist 和 Pischke 书中的相应章节)。所以重要的一点是,如果由于某种原因导致不合规,我们必须证明这不会使随机化无效。那么这个仪器就可以了,否则我们不能使用它。

有几种方法可以对此进行测试。你可以回归仪器Zi关于不受治疗影响的个人特征Di比如年龄、种族等,这些都是之前确定的Di决心,决意,决定。另一项检查是测试仪器对样本结果的影响,而两者之间没有关系DiZi,就像在收到抽签号码之前自愿参加的志愿者一样。这个想法是,如果您的彩票号码影响您以后收入的唯一原因是通过服务状态,那么在与服务状态无关的样本中,选秀资格应该不会影响收入。

Angrist (1990)执行其中一些检查来解决您的问题。尽管存在上述问题,但事实证明,选秀彩票似乎是一种可靠的工具。Berinsky (2010)提供了更多的随机检查,并提供了有关彩票历史的更多背景信息。