何时使用固定效果与使用集群 SE?

机器算法验证 计量经济学 多层次分析 固定效应模型 内生性 聚集标准错误
2022-01-18 22:36:00

假设您有一个数据的单个横截面,其中个人位于组内(例如学校内的学生),并且您希望估计一个模型,Y_i = a + B*X_i其中X是个人水平特征的向量和a常数。

在这种情况下,假设未观察到的组间异质性会使您的点估计B及其 SE 产生偏差,因为它与您感兴趣的自变量相关。

一种选择是按组(学校)对您的 SE 进行聚类。另一个是包括组 FE。另一种是同时使用。在这些选项之间进行选择时应该考虑什么?特别不清楚为什么人们可能按组对 SE 进行聚类并使用组 FE。在我的具体情况下,我有 35 个组和 5,000 个人嵌套在每个组中。我已经关注了这个 pdf中的讨论,但不清楚为什么以及何时可以同时使用集群 SE 和固定效果。

(请讨论集群 SE 与 FE 的优缺点,而不是建议我只适合多级模型。)

3个回答

使用组固定效应和/或集群调整标准误差的两种方法都考虑了与集群(或面板)数据相关的不同问题,我会清楚地将它们视为不同的方法。通常你想同时使用它们:

首先,集群调整的标准误差解释了集群内相关性或异方差性,除非您愿意做出进一步的假设,否则固定效应估计器不会考虑这些,请参阅Imbens 和 Wooldridge 讲座幻灯片,以了解简短的讨论和长面板以及与此问题相关的各种问题Cameron 和 Miller 也有一篇关于这个主题的新论文:A Practitioner's Guide to Cluster-Robust Inference,您可能会感兴趣。如果您不想对方差-协方差矩阵进行建模并且您怀疑存在集群内相关性,我建议使用集群稳健标准误差,因为您的 SE 中的偏差可能很严重(比异方差更成问题,请参阅Angrist & Pischke 第 III.8 章讨论了这个话题。但是你需要足够的集群(Angrist 和 Pischke 说 40-50 作为拇指的角色)。集群调整的标准误差考虑了标准误差,但保持你的点估计不变(标准误差通常会上升)!

固定效应估计考虑了未观察到的时不变异质性(如您所述)。这可能是好是坏:另一方面,您需要更少的假设来获得一致的估计。另一方面,您丢弃了很多可能有用的方差。像 Andrew Gelman 这样的人更喜欢分层建模而不是固定效果,但这里意见不同。固定效应估计将改变点估计和区间估计(这里的标准误差通常会更高)。

总结一下:如果您不想为集群间和集群内相关性建模(并且有足够的可用集群)而烦恼,那么集群稳健标准误差是一种解决与集群数据相关的可能问题的简单方法。固定效应估计将仅使用某些变化,因此是否要根据较少的变化进行估计取决于您的模型。但是如果没有进一步的假设,固定效应估计将无法解决与方差矩阵的集群内相关性相关的问题。集群稳健标准误差也不会考虑与使用固定效应估计相关的问题。

固定效应用于消除数据中不同组之间未观察到的异质性。

我不同意接受的答复中暗示使用有限元模型的决定将取决于您是否要使用“更少的变化”。如果您的因变量受到面板中各组系统性变化的不可观察变量的影响,那么与此变化相关的任何变量的系数都会有偏差。除非您的 X 变量是随机分配的(并且它们永远不会与观察数据一起使用),否则通常很容易使遗漏变量的论点产生偏差。可以能够通过良好的控制变量列表来控制一些遗漏的变量,但如果强识别是您的首要目标,那么即使是大量的控制列表也会给批判性读者留下怀疑您的结果的空间。在这些情况下,使用固定效应模型通常是个好主意。

聚类标准误差用于说明每组内的观察不是独立同分布(独立同分布)的情况。

一个典型的例子是,如果您对一组公司在一段时间内有很多观察结果。您可以考虑公司层面的固定效应,但您的因变量中仍可能存在一些无法解释的变化,这些变化与时间相关。通常,在处理时间序列数据时,通常可以安全地假设组内误差项中的时间序列相关性。这些情况是集群 SE 最明显的用例。

一些说明性示例:

如果您有随机分配治疗的实验数据,但随着时间的推移对每个个体/组进行重复观察,您将有理由省略固定效应,但希望对您的 SE 进行聚类。

或者,如果您对非实验数据的每组有许多观察,但每个组内观察都可以被视为从更大的组中抽取的独立同分布(例如,您有来自许多学校的观察,但每个组都是随机抽取的子集来自他们学校的学生),您可能希望包括固定效应,但不需要集群 SE。

这些答案很好,但最近和最好的答案是由Abadie 等人提供的。(2019)“你应该什么时候调整聚类的标准误差?” 对于固定效应,集群的一个主要原因是集群中的治疗效应存在异质性。还有其他原因,例如,如果集群(例如公司、国家)是人口中集群的子集(您正在推断)。聚类是一个设计问题,是本文的主要信息。不要盲目地去做。