指定具有多个时间段的差异模型的差异

机器算法验证 回归 造型 计量经济学 面板数据 差异中的差异
2022-02-10 12:35:31

当我估计具有两个时间段的差异模型的差异时,等效回归模型将是

一种。 Yist=α+γsTreatment+λdt+δ(Treatmentdt)+ϵist

  • 在哪里Treatment是一个虚拟变量,如果观察来自治疗组,则等于 1
  • d是一个假人,在治疗发生后的时间段内等于 1

因此,该等式采用以下值。

  • 对照组,治疗前:α
  • 对照组,治疗后:α+λ
  • 治疗组,治疗前:α+γ
  • 治疗组,治疗后: α+γ+λ+δ

因此,在两期模型中,差异估计的差异为δ.

但是发生了什么事dt如果我有多个治疗前和治疗后期?我是否仍然使用一个假人来表明一年是在治疗之前还是之后?

或者我是否添加了年份虚拟变量而不指定每一年是属于治疗前还是治疗后?像这样:

湾。Yist=α+γsTreatment+yeardummy+δ(Treatmentdt)+ϵist

或者我可以同时包括两者(即yeardummy+λdt)?

C。Yist=α+γsTreatment+yeardummy+λdt+δ(Treatmentdt)+ϵist

总之,我如何指定具有多个时间段(a、b 或 c)的差异模型的差异?

2个回答

估计具有两个以上时间段的差异模型差异的典型方法是您提出的解决方案 b)。保持你的符号你会倒退

Yist=α+γs(Treatments)+λ(year dummyt)+δDst+ϵist
在哪里DtTreatmentsdt是一个虚拟变量,对于处理单元等于 1s在治疗后期间(dt=1) 否则为零。请注意,这是对差异回归中差异的更一般的表述,它允许对不同处理单元进行不同的处理时间。

正如评论中正确指出的那样,您提出的解决方案 c) 由于与时间假人和后处理期间的假人共线性而无法解决。然而,这种情况的一个轻微变体是稳健性检查。γs0γs1是每个控制单元的两组虚拟变量s0和每个处理单元s1,然后分别将处理单元的虚拟变量与时间变量进行交互t和回归

Yist=γs0+γs1t+λ(year dummyt)+δDst+ϵist
包括单位特定的时间趋势γs1t. 当您包括这些单位特定的时间趋势和差异系数的差异时δ没有显着变化,您可以对自己的结果更有信心。否则,您可能想知道您的治疗效果是否由于潜在的时间趋势而吸收了治疗单位之间的差异(当政策在不同时间点开始时可能发生)。

Angrist 和 Pischke (2009) Mostly Harmless Econometrics 中引用的一个例子是Besley 和 Burgess (2004)的劳动力市场政策研究。在他们的论文中,包含特定州的时间趋势会扼杀估计的治疗效果。请注意,对于此稳健性检查,您需要 3 个以上的时间段。

我想澄清一些事情(并间接解决评论中的问题)。特别是,它涉及使用特定于单位的线性时间趋势。作为稳健性检查,您似乎只是在处理处理单元的交互虚拟对象(即,γ1s) 具有连续的时间趋势。但是,实际上是您将一整套单位/状态假人(单位/状态固定效应)与线性时间趋势变量进行交互。

Angrist 和 Pischke (2009) 在Mostly Harmless Econometrics的第 238 页推荐了这种方法符号的差异会引起混淆。复制规范 5.2.7:

yist=γ0s+γ1st+λt+δDst+Xistβ+εist,

在哪里γ0s是一个特定于状态的截距,根据s他们书中使用的下标。您可以查看γ1s作为特定于状态的趋势系数乘以时间趋势变量,t. 不同的论文使用不同的符号。例如,Wolfers (2006) 复制了一个包含特定状态线性时间趋势的模型。复制模型(1):

ys,t=sStates+tYeart+sStatesTimet+δDs,t+εs,t,

其中模型包括州和年度固定效应(即每个州和年度的虚拟变量)。治疗变量Ds,t是什么时候状态s期间采取单方面离婚制度t. 请注意,此规范将状态虚拟变量与线性时间趋势(即,Timet)。这是模型规范中特定于状态的线性时间趋势的另一种表示形式。

此处的评论部分也很好地解决了特定于单位的线性时间趋势

总之,您希望将所有单位(组)虚拟变量与连续时间趋势变量进行交互。

您可以在这里免费阅读 Justin Wolfers (2006) 的论文