关于 DDD(TD,triple-diff)估计器的 3 个相关问题

机器算法验证 面板数据 计量经济学 差异中的差异
2022-03-20 03:04:26

在 Jeff Wooldridge 的《计量经济学分析》(第 2 版)中,他在第 151 页推导出了B 州实施针对老年人的医疗保健政策变更的两个时期案例的差异中差异 (DDD) 估计量的表达式.

首先,我很困惑为什么方程(6.56)没有第四项

(y¯A,N,2y¯A,N,1),

这将对应于未改变其政策的州(A 组)中非老年人(N 组)的平均健康结果的变化。

他引用 Gruber (1994) 使用这种方法,但我对该论文中表 3 的解读是,它是两个 DD 的差异,所以你需要第四项来拥有它(否则你会得到δ3+δ0而不仅仅是δ3)。

我已经检查了第二次印刷的勘误表,但没有出现,所以我一定在这里遗漏了一些东西。它也以相同的形式出现在他2007 年的 NBER 讲义中。


我的第二个问题是,在超过两个时间段的情况下,JW 建议的回归包括:

  • 一整套状态类型(A或B)的假人
  • 年龄类别(E或N)的全套假人
  • 所有时间段的假人
  • 前三个之间的成对交互
  • 一个策略虚拟对象,对于受策略约束的组和时间段取值为 1,这是感兴趣的 DDD 参数

JW 写了“全套假人”和“所有时间段”,但我不确定如何在不陷入虚拟变量陷阱的情况下做到这一点。放弃A型状态一和非老年人状态(N组)似乎很自然,但是假设我有10个时间段,并且治疗发生在第5期。如何选择要放弃哪个时间假人以避免假人变量陷阱?这种选择似乎改变了 DDD 参数及其解释,但我不确定是否最好。这是另一个自然选择的问题,因为有一个单一的前期可以作为基线。


最后,DDD 的识别假设到底是什么,类似于普通 DD 的常见趋势?有什么方法可以测试/支持多个时期吗?

在 Myoung-jae Lee 的Micro-Econometrics for Policy, Program, and Treatment Effects中,条件(翻译成 JW 的例子)被列为

δ3+E[u1,2u0,1|E=1,B=1]E[u0,2u0,1|E=1,A=1]E[u0,2u0,1|N=1,B=1]E[u0,2u0,1|N==1,A=1],
其中第一个下标索引潜在结果(1 处理,0 如果没有),第二个是时间(post 是 2,pre 是 1)。我将其解释为,只要与其他地方的老年人相比,治疗状态的老年人随时间的不可观察变化的幅度与非老年人的相同数量相似,那么 DDD 就确定了正确的效果。这似乎比一般趋势弱,这对于 DDD 来说已经足够了,但不是必需的。它是否正确?

1个回答
  1. 你是对的。在这张2011 年的幻灯片中,等式 (4) 的幻灯片 6 显示了缺失的项。正如您所提到的,要记住的解释是,三重差异是两个差异之间的差异。
  2. 您说得对,估计要求您省略时间、状态和年龄组固定效应的参考类别(以避免共线性)。但是,参考类别的选择对于三重差分项的估计量应该无关紧要。请注意,您可以将假人直接写为时间段、状态和年龄组之间的交互,请参阅 Pischke讲义中的方程式(第 16 页底部)。
  3. 一种构建识别假设的方法如下。在标准的 DiD 中,如果不存在治疗,您希望您的两个群体以相似的方式进化。在三重差异中,您希望您的治疗状态和您的状态之间的差距在没有治疗的情况下随着时间的推移对于老年人和年轻人类似地演变。您还可以将其框定为切换状态和年龄组。您将经验性地测试这一点的方式首先是在治疗发生之前观察趋势(如果您在治疗发生之前有数据)。在 DiD 案例中,您只需绘制治疗前每年的治疗和对照平均值。在三重差异的情况下,您可以使用四行进行相同的操作,或者更方便的是,您可以针对每个年龄组和年份绘制处理状态和对照状态之间的差距,