2 期差固定效应与 OLS

机器算法验证 回归 计量经济学 最小二乘 固定效应模型
2022-04-16 23:00:18

我有一个关于差异估计量的问题。假设我的数据由两个时期组成,并且对时期中的一些人进行了治疗t=2. 我估计这个模型:

yit=β0+β1treatmenti+β2yeart+β3treatmenti×yeart+β4xit+uit

个人i=1,,Nt=1,2.treatmenti是治疗假人(治疗个体为 1,否则为 0),yeart是一个虚拟周期(第二个周期为 1,否则为 0)。我有兴趣估计β3,差异中的差异系数。xit是一个控制变量并且uit是误差项。面板是平衡的,因此不会丢失任何观察结果。

这是我的问题。如果我在没有任何控制变量的情况下运行这个回归(所以下降xit) 那么 OLS 和固定效应给出完全相同的估计β3. 但是,在包含一个(或多个)控制变量的模型中(因此,包括xit现在),情况不再如此。即,在这种情况下,固定效应和 OLS 估计量β3不再完全相同。我已经在两个数据集中以及使用模拟数据进行了检查。估计值通常非常相似,但我仍然有兴趣弄清楚为什么固定效应和 OLS 没有给出完全相同的估计值β3在具有控制变量的两期 DiD 模型中(特别是因为我担心我可能会遗漏一些非常明显的东西)。谢谢。

2个回答

@查理是对的。你只有两个时间段,所以不可避免地会有变化i- 特定样本方差xit. 此外,即使您将模拟编程为具有同质效应,由于周期数少,它们之间不可避免地会存在一些样本相关性。xit并且,例如,您的错误项,因此不可避免地会有一些“效果异质性”在i- 之间的特定部分关系xityit. 条件方差和效应异质性的相互作用使您对系数的 FE 估计倾斜xit. 上的系数xit是精确加权平均值i- 特定系数xit. 当您将 OLS 拟合到上面指定的模型时,会发生不同的倾斜:现在,xit是系数的精确加权平均值xit对于那些有treatmenti=1和那些有treatmenti=0. 这些差异会传播到您对β3. 想想弗里施沃洛弗尔。为了证明查理的主张的有效性,只需生成xit,其中每个变量的方差都是恒定的i,但你仍然有不同的模式。例如,随机分配i要么有(xi1,xi2)=(0,1)或者(1,0). 如果您这样做,您将看到 FE 和 OLS 估计之间的差异消失了。

首先,与 OLS 相比,我不确定您所说的“固定效应”回归是什么意思。至少在计量经济学中,标准的固定效应模型是通过 OLS 估计的。我假设您使用组均值而不是单个数据进行回归,但我不确定。

在你的模型中没有x,它是完全灵活的:年份和治疗的所有组合都被赋予不同的期望值。您在这里没有做任何线性假设。一旦你添加x,你假设响应yx是线性的,并且这种响应不依赖于固定效应的值也就是说,影响不存在异质性x. 如果存在异质性,您可以使用不同的估计程序得到不同的结果。

我和我的合著者在我们的论文“破碎效应还是固定效应?”中讨论了这些问题。.