机器算法验证 - 关于 DDD（TD，triple-diff）估计器的 3 个相关问题 - 吾爱随笔录

在 Jeff Wooldridge 的《计量经济学分析》（第 2 版）中，他在第 151 页推导出了B 州实施针对老年人的医疗保健政策变更的两个时期案例的差异中差异 (DDD) 估计量的表达式.

首先，我很困惑为什么方程（6.56）没有第四项

({\bar{y}}_{A, N, 2} - {\bar{y}}_{A, N, 1}),

$(\bar y_{A,N,2} - \bar y_{A,N,1}),$

这将对应于未改变其政策的州（A 组）中非老年人（N 组）的平均健康结果的变化。

他引用 Gruber (1994) 使用这种方法，但我对该论文中表 3 的解读是，它是两个 DD 的差异，所以你需要第四项来拥有它（否则你会得到 $\delta_3 + \delta_0$ 而不仅仅是 $\delta_3$ ）。

我已经检查了第二次印刷的勘误表，但没有出现，所以我一定在这里遗漏了一些东西。它也以相同的形式出现在他2007 年的 NBER 讲义中。

我的第二个问题是，在超过两个时间段的情况下，JW 建议的回归包括：

一整套状态类型（A或B）的假人
年龄类别（E或N）的全套假人
所有时间段的假人
前三个之间的成对交互
一个策略虚拟对象，对于受策略约束的组和时间段取值为 1，这是感兴趣的 DDD 参数

JW 写了“全套假人”和“所有时间段”，但我不确定如何在不陷入虚拟变量陷阱的情况下做到这一点。放弃A型状态一和非老年人状态（N组）似乎很自然，但是假设我有10个时间段，并且治疗发生在第5期。如何选择要放弃哪个时间假人以避免假人变量陷阱？这种选择似乎改变了 DDD 参数及其解释，但我不确定是否最好。这是另一个自然选择的问题，因为有一个单一的前期可以作为基线。

最后，DDD 的识别假设到底是什么，类似于普通 DD 的常见趋势？有什么方法可以测试/支持多个时期吗？

在 Myoung-jae Lee 的Micro-Econometrics for Policy, Program, and Treatment Effects中，条件（翻译成 JW 的例子）被列为

δ_{3} + E [u_{1, 2} - u_{0, 1} | E = 1, B = 1] - E [u_{0, 2} - u_{0, 1} | E = 1, A = 1] - E [u_{0, 2} - u_{0, 1} | N = 1, B = 1] - E [u_{0, 2} - u_{0, 1} | N = - = 1, A = 1],

$\delta_3 + E[u_{1,2} - u_{0,1}\vert E=1,B=1]-E[u_{0,2} - u_{0,1}\vert E=1,A=1]-{E[u_{0,2} - u_{0,1}\vert N=1,B=1]-E[u_{0,2} - u_{0,1}\vert N=-=1,A=1]},$ 其中第一个下标索引潜在结果（1 处理，0 如果没有），第二个是时间（post 是 2，pre 是 1）。我将其解释为，只要与其他地方的老年人相比，治疗状态的老年人随时间的不可观察变化的幅度与非老年人的相同数量相似，那么 DDD 就确定了正确的效果。这似乎比一般趋势弱，这对于 DDD 来说已经足够了，但不是必需的。它是否正确？