假设您有一个数据的单个横截面,其中个人位于组内(例如学校内的学生),并且您希望估计一个模型,Y_i = a + B*X_i
其中X
是个人水平特征的向量和a
常数。
在这种情况下,假设未观察到的组间异质性会使您的点估计B
及其 SE 产生偏差,因为它与您感兴趣的自变量相关。
一种选择是按组(学校)对您的 SE 进行聚类。另一个是包括组 FE。另一种是同时使用。在这些选项之间进行选择时应该考虑什么?特别不清楚为什么人们可能按组对 SE 进行聚类并使用组 FE。在我的具体情况下,我有 35 个组和 5,000 个人嵌套在每个组中。我已经关注了这个 pdf中的讨论,但不清楚为什么以及何时可以同时使用集群 SE 和固定效果。
(请讨论集群 SE 与 FE 的优缺点,而不是建议我只适合多级模型。)