我正在使用 OLS 模型分析一些数据。数据代表为美国城市工作的经理。在每个城市中,我们调查了不止一位经理(最多 5 位)。对每个州的多个城市进行了调查。
我想使用聚类标准误差来解释城市或州一级可能出现的聚类(州政策可能与我们的研究相关)。一些研究人员(例如,Cameron & Miller, 2015)建议在最高级别(在我的情况下为州级别)进行聚类。作为检查,我尝试在两个级别上估计集群 SE,并且:
- 当我在城市级别使用集群 SE 时,标准误差会稍微变大,但总体上它们与 OLS 结果非常相似。
- 当我在州级使用集群 SE 时,标准误差变得更小,导致与 OLS 模型完全不同的结果。
造成这种差异的可能原因是什么?我应该考虑哪些估计?当我查看状态级别时,标准错误变化更多的事实,这是否表明状态级别的聚类更重要?
我的样本包含 2250 个观测值,分组在 487 个城市(平均集群大小 = 4,但一些集群大小 = 1)和 49 个州(平均集群大小 = 30)。