据说DID(difference-in-difference)是固定效应模型的一个特例。但是,据我了解,它们解决了不同的问题:
在 DID 的情况下,存在一个随时间变化的未观察到的混杂因素。基于共同趋势假设,我们通过取差值来贬低其影响。
然而,在固定效应模型的情况下,未观察到的混杂因素是时间不变性,这是固定效应模型最重要的假设之一。
有人可以为我澄清一下吗?
据说DID(difference-in-difference)是固定效应模型的一个特例。但是,据我了解,它们解决了不同的问题:
在 DID 的情况下,存在一个随时间变化的未观察到的混杂因素。基于共同趋势假设,我们通过取差值来贬低其影响。
然而,在固定效应模型的情况下,未观察到的混杂因素是时间不变性,这是固定效应模型最重要的假设之一。
有人可以为我澄清一下吗?
在扩展我们的直觉以了解差异中的差异 (DD) 估计如何提供任何改进之前,让我们从对标准固定效应估计器的理解开始。
假设您在一段时间内重复观察个人。例如,假设我们要估计以下模型:
其中表示一个固定参数。我们可以将这种固定效应定义为个体异质性不同,但随着时间的推移是稳定的。这些时不变变量中的一些可以被观察到并为研究人员所知(例如,性别、种族、民族等);有些可能未被观察到,但仍被认为是个体异质性的来源(例如,与生俱来的能力、稳定的人格特征、气质等);而且,其他一些稳定因素可能是研究人员没有观察到和不知道的。在固定效应规范中,贬低会消除(即“扫除”)固定效应。时不变变量的平均值是时不变变量,因此贬低“消除”(减去)个体的稳定特征,这些特征在个体之间不同但随着时间的推移是稳定的。
正是个人在生活中经历的变化促使我们使用固定效应方法。然而,这些决定通常在个人的控制之下。人们换工作;他们结婚了; 他们赚更多的钱;他们改变了他们的政治派别;他们移动;他们有孩子;他们加入工会;他们参军;他们辍学;他们被捕。在实践中,我们希望了解人们生活中的这种变化(治疗/暴露)如何影响这种变化在另一个变量(结果)中。例如,更多的教育会降低婴儿死亡率吗?一个人的工会身份会影响工资吗?但是,当治疗/暴露状态的变化受我们随时间观察的各个单位的控制时,对与治疗/暴露状态变化相关的未观察到的因素的担忧仍然存在。
请注意,上述等式也可以被视为具有两个误差源:和。中嵌入的特殊的时变因素通常会促使研究人员获得一个对照组。想一想可能影响个人决策的大量未观察到的随时间变化的因素。很多时候,控制这些决定的是个人,而不是研究人员。
固定效应确定对发生变化的个人的影响。但是,为什么有些人会改变,而其他人不会?这导致了固定效应的主要缺点之一:它无法调查自变量的单位内变化对未经历变化的个体的某些结果变量的单位内变化的影响。简而言之,固定效应模型仅使用单位内变化。该模型识别单位内的影响,并且它是恒定的单位内。这是一种特殊的控制,因为我们控制稳定的特性,稳定地造就你,你。固定效应规范中的反事实是被处理/暴露的个体。也就是说,个人充当自己的控制者。同样,该模型没有解决随时间的变化。
克服时变混杂的一种方法是收集关于未暴露于感兴趣的治疗/暴露的个人或实体(例如,公司、县、州等)的数据。这允许您将单元划分为处理或控制条件。现在您可以观察治疗组和未治疗组随着时间的推移而变化。外部对照组是在没有治疗暴露的情况下,治疗/暴露组会发生的事情的反事实。
输入 DD 模型。在 DD 规范下,我们测量的是治疗组结果的前后变化相对于对照组结果的前后变化。重要的是要注意这里的细微区别。在 DD 设置中,治疗暴露的变化通常在观察单位之外确定。例如,一项政策/法律可能会在县/州一级引入并影响该州内的特定个人/实体群体。很多时候,这些政策/法律不会在所有地方生效。因此,这些“非采用者”可以作为适当的反事实。这是 DD 模型的吸引人的特点之一;您可以利用这种变异来源。
据说DID(difference-in-difference)是固定效应模型的一个特例
正确的。文本通常将 DD 称为固定效果的“特例”。固定效应和DD 模型都包括针对个人或更高级别实体(例如,公司、县、州等)的“固定效应”,这些实体控制在这些个人或更高级别内随时间保持不变的因素(包括观察到的和未观察到的)级实体。同样,DD 方法至少需要一些单元不暴露于治疗/政策/干预。而且,仅需要组级别的信息来识别您的治疗效果。
这是具有两组和两个周期的规范 DD 设置:
我们可以在时间段观察处于状态。这是一个将数据“汇总”到更高级别的示例,其中一些州引入了新的法律/政策,而其他州则没有。您可以用所有组(状态)的假人估计这个方程,但假人(即“固定效应”)将吸收治疗变量。当您有不同的州在不同的时间引入法律/政策时,这一点会变得更加清晰。上述等式的推广将包括每个状态和每个时间段的虚拟变量,但其他方面保持不变。例如,
其中新的治疗假人与之前相同。注意,表示状态固定效应。包含所有状态的虚拟变量在代数上等同于对均值偏差的估计。由于在这种更高级别的聚合中包含了固定效应,DD 方法确实允许基于时间不变的未观察到的特征进行一些选择。
我希望这能让您更好地理解为什么 DD 是固定效果的特例。至于建立因果关系,固定效应并不总能削减它。由你来证明政策/治疗的变化是合理的。