没有预处理的差异?

机器算法验证 计量经济学 面板数据 固定效应模型 观察研究 差异中的差异
2022-03-29 01:29:46

典型的差中差估计量(作为固定效应)适合以下形式的模型

yit=αi+δTit+Xitβ+ϵit

在哪里T是一些治疗发生在i有时t.

系数δ是从 T 从零到一的时间段之间的跳跃确定的,在控制了不随时间变化的不可观察值之后,基本上将那些在该期间未得到处理的反事实用作反事实。

通常,(面板)数据集以每个人未处理开始,以一些未处理而其他人得到处理结束。或者,如果每个人(最终)都得到治疗,您仍然可以包含治疗后数据以提高统计精度——δ仍然可以从一些人得到治疗而另一些人没有得到治疗的时间段中识别出来。

我的问题:适合一组开始治疗,另一组开始未治疗,然后未治疗组接受治疗的模型是否合法?这基本上是一组未接受治疗而一组接受治疗的情况的镜像——我们在某些时期仍然存在异质性。从数学上看,它似乎是相同的——标准错误组件的动机似乎仍然适用。

我错过了什么吗?

1个回答

我在您的方法中看到的问题是,除非您对实验或政策有非常精确的信息,否则您将无法看到任何有关预处理差异的信息。对于治疗组和对照组之间的共同趋势假设,很难甚至不可能说些什么,这是差异差异的重要组成部分。

例如,假设您有一个强制性的就业市场计划,但在第 1 阶段,只有积极进取的人才会参加。在第 2 阶段,即您的数据的起点,政策制定者强迫其他人参加就业市场计划,最后在第 3 阶段,您会看到所有“接受治疗”的个人。在这种情况下,很难说在第 1 期治疗的患者和在第 2 期治疗的患者的结果趋势相同

  1. 由于未观察到的因素导致第一轮治疗选择
  2. 由于第 1 阶段的个人已经接受治疗,因此他们的趋势已经改变(如果政策有效)。

当然,这是一个非常人为的例子,主要是因为治疗是非随机的,但我想你会明白这一点。如果没有更多关于实验的知识,您就无法在此设置中可信地推销差异分析的差异,因为您无法说出两组结果的治疗前差异。即使您知道治疗是随机的,您也无法确定这种常见的趋势假设。实际上,无论如何你很少能确定它,但通过预处理数据,你至少可以有一个想法。