差分设计如何解释时间自相关

机器算法验证 时间序列 因果关系 差异中的差异
2022-03-24 17:35:19

尽管毫无疑问有许多技术可以研究离散干预随时间的影响,但我对两种在社会科学中得到广泛采用的技术感兴趣:

前者应用时间序列分析的所有原则,使用 ARIMA 模型来解释非平稳性、自相关等。后者使用线性回归或变体,但允许控制组。

如果有的话,差异中的差异被更广泛地采用,特别是在经济文献中(在 Card、Angrist 等之后),而且在健康相关领域和可能的教育领域(似乎被称为“比较间断时间序列” )。然而,在存在大量自相关的情况下(可能在所使用的数据集类型中),它似乎夸大了估计结果的精度。

我的问题是:

  1. 如果存在自相关,差异分析如何有效?
  2. 是否有允许使用控制组的时间序列技术?
2个回答

你关于 DiD 中标准错误的观点是一个重要的问题,直到Bertrand 等人的论文之前一直被忽略或遗忘。(2004 年)“我们应该在多大程度上相信差异中的差异估计?” 在经济学季刊上。他们在那里讨论了几种克服自相关问题的方法,这将回答您的第一个问题。

具体来说,他们检查:

  1. 参数适应——这些适应不是特别好,它们归因于由于 DiD 工作中典型的短时间序列而低估了自相关系数,以及一个错误指定的过程。(AR(1))
  2. Block bootstrap - 这也表现不佳,他们将其归因于 DiD 工作中典型的少量块 [Cameron、Gelbach、Miller 似乎与此相关]。
  3. 他们称之为“经验方差-协方差矩阵”——这避免了 SE 膨胀,但也具有低功率,并且依赖于所有州的 DGP 相同。
  4. 他们自己设计的任意 VC 矩阵 - “因此,当处理单元的数量足够大时,这种方法似乎效果很好。”
  5. 前/后(丢弃所有额外的年份信息) - 他们建议对模型残差执行此操作,以便控制一些趋势和协变量信息,并建议当处理单元的数量很大时它工作得很好。
  6. 随机化推断——这是他们的主要建议,在第 4.6 节中。“它消除了过度拒绝问题,并且与样本量无关。此外,它似乎具有与其他测试相当的能力。”

至于你的第二个问题,我有点困惑,因为一旦你有了一个控制组,你本质上就是在处理面板数据,而不是纯粹的时间序列。从这个意义上说,DiD 比较了对照和治疗单位的时间序列数据之间的干预效果,但也许我误解了这个问题。

最后一个建议:如果您对比 DiD 更新的方法(但相似)感兴趣,请查看 Abadie 和他的合著者的合成控制方法。特别是如果您有汇总数据,这可能是对您的工作特别有用的方法,并且在最近的经济学论文中越来越多地使用它。

在@Andy 发表评论之前,我在此背景下没有考虑过的另一篇论文是 Cameron, Gelbach, Miller 的“Robust Inference with Multi-Way Clustering”

重新阅读后,看起来他们明确地复制了 Bertrand (2004) 策略并通过他们的多向聚类(这是他们从更著名的 CGM 论文中的单向聚类策略的推广)来处理它。