控制变量-差异中的差异

机器算法验证 造型 计量经济学 差异中的差异
2022-04-03 16:44:54

我正在对差异估计进行差异化。关于控制变量添加我有点困惑。我是否要添加影响因变量的控制变量或影响因变量但不会影响政策对因变量的影响的控制变量。

1个回答

在差异回归的差异中包含协变量有两个原因:

  • 用于确定治疗效果;
  • 减少误差方差(即增加统计检验的能力)。

假设您想知道就业市场计划对城市就业的影响,该计划被随机分配给失业人员。你回归 其中是结果(0 = 失业,1 = 就业),是虚拟变量,等于 1在治疗期间,个体,组(1 = 治疗组,0 = 对照组),表示时间段(1 = 治疗后,0 = 治疗前),是组和周期固定效应,而是一个随机误差项。

Yigt=γg+λt+βJgt+ϵigt,
YJigtγλϵ

这相当于回归 您在其中表示治疗组和对照组,以及两个假人的治疗前和治疗后时期,然后它们会相互作用。这可能是您在教科书或课堂笔记中看到的差异回归的差异。

Yigt=α+β1treati+β2postt+β3(treat post)it+ϵit,

假设在这两个时期我们城市的GDP都在增加。然后结果受到另一个与就业市场计划无关但同时发生的时变因素的影响。这违反了常见的趋势假设。为了在第一个回归中不夸大,您可能希望将 GDP 作为控制纳入回归中,以分离出这种与就业市场计划无关的对结果的额外影响。这是在回归 β

Yigt=γg+λt+βJgt+δGDPt+ϵigt.

仅需要组级别(治疗控制)的信息来识别您的治疗效果。如果您有关于您的个人的其他信息,例如他们的年龄,您也可以将其包含在回归中,如下所示: 年龄的组内变化对于识别无关紧要(有关详细说明,请参见此处的注释),但它们可以帮助减少回归的误差方差。在这种情况下,您的统计检验将具有更大的效力,并且更容易确定是否具有显着影响。

Yigt=γg+λt+βJgt+δGDPt+θageigt+ϵigt.
β