我有一个给定的数据集,我被要求拟合一个合并的 OLS 回归模型,然后是一个具有特定变量的固定效应模型。根据我所做的研究,我认为合并 OLS 回归只是面板数据回归。
我认为它应该类似于下面的代码,但如果我错了,请纠正我。
result1 <- plm(scrap ~ hrsemp, effect = "individual", model = "pooling", data = panel_data1)
但是什么是固定效应模型呢?
我有一个给定的数据集,我被要求拟合一个合并的 OLS 回归模型,然后是一个具有特定变量的固定效应模型。根据我所做的研究,我认为合并 OLS 回归只是面板数据回归。
我认为它应该类似于下面的代码,但如果我错了,请纠正我。
result1 <- plm(scrap ~ hrsemp, effect = "individual", model = "pooling", data = panel_data1)
但是什么是固定效应模型呢?
有一个重要的区别。如果存在未观察到的异质性(即影响因变量的某些未观察到的因素),并且这与某些观察到的回归量相关,则 POLS 是不一致的,而 FE 是一致的。如果没有未观察到的异质性(不太可能),或者这与所有回归变量不相关,则 POLS 和 FE 都是一致的(尽管效率不高)。
假设一个简单的模型:
在哪里是时变因子的向量,是一个时不变因子的向量,是个体效应(或未观察到的、随时间变化的异质性),以及是一个特殊的错误(即它是个别时期所独有的)。
为简单起见,假设时变因素具有外生性。这是:
(如果不是,我们需要考虑工具,就像在非面板数据世界中一样)。
合并 OLS (POLS):如果 不相关, OLS 一致但效率低下(因为序列相关)。使用调整后的 POLS。如果与....有关,POLS不一致。
固定效应 (FE)(或组内,WG):估计一个贬义模型。也就是说,它会为每个人减去每个时变变量的周期平均值。由于固定效应是恒定的,这种方法消除了!. 因此,无需担心之间的相关性和,我们可能会担心它确实存在。请注意,FE 基本上是去均值模型的 POLS,并且在未观察到的异质性与时变因变量之间存在相关性的情况下是一致的。
注意:FE 估计的质量取决于回归变量随时间变化的程度,因为估计使用的是去均值数据,即时间差。此外,所有不变的变量都被消除了。例如,如果我们想估计学校教育对收入的影响(假设它们是恒定的),FE 在控制未观察到的能力方面不太成功。因此,如果仅存在有限的时间序列(“内部”)变化,则 FE 不精确。