为什么在差异中使用控制变量?

机器算法验证 回归 多重回归 因果关系
2022-03-01 08:20:37

我对以下标准方程的差异方法有疑问:

y=a+b1treat+b2post+b3treatpost+u
其中treat 是治疗组和岗位的虚拟变量。

现在,我的问题很简单:为什么大多数论文仍然使用额外的控制变量?我认为如果平行趋势假设是正确的,那么我们就不必担心额外的控制。我只能想到为什么要使用控制变量的两个可能原因:

  1. 没有它们,趋势就不会平行
  2. 因为 DnD 规范将治疗组和对照组在治疗时的任何趋势差异归因于干预(即交互项treat*post) - 当我们不控制其他变量时,交互的系数可能超过-/低调

任何人都可以对这个问题有所了解吗?我的理由 1) 或 2) 是否有道理?我不完全理解 DnD 中控制变量的使用。

4个回答

没有它们[即附加变量],趋势将不会平行

是的,这是正确的。除非您将随时间变化的变量添加到模型中,否则您可能没有考虑到特定于单位的趋势。

即使在没有额外变量的情况下满足平行趋势假设,添加额外变量也可以提高估计的精度,就像在其他回归中一样。我认为这是 Michael Chernick 的想法的一部分。

Mostly Harmless Econometrics有一个很好的讨论,可能会有所帮助。尤其参见第 236-37 页。

有时,当我们通过计算治疗后与治疗前的反应差异来观察治疗效果时,我们会说患者作为自己的控制者。提供对照组的目的是解释所谓的安慰剂效应。有时即使不进行治疗也会有积极的变化。所以我们要确定的效果是高于“安慰剂效应”的平均增幅。

是的,你的两个观点都有道理。要查看两种不同风格的 diff-in-diff 模型的派生,您可以查看我关于该主题的演讲幻灯片

继续迈克尔的回答,您希望提供尽可能多的证据证明 E[u|treat] = 0。这是一个假设并且永远无法直接验证,但您希望向读者提供尽可能多的信任,因为您已经想到了它的原因可能持有。添加控件有效地开始分解 u。而且,某些控件可能无法满足您的所有需求,但可能会让您了解您可能不需要担心的事情的类型。例如,如果您对 IQ 进行了控制,那么这可能有助于减轻对遗漏变量对能力的担忧。