是否应该使用 Hausman 检验来决定固定效应与随机效应之间的关系?

机器算法验证 面板数据 多层次分析 随机效应模型 固定效应模型 豪斯曼
2022-04-09 00:21:10

我被告知应该在多级建模中使用 Hausman 检验,以检查是否可以使用随机效应。

然而,我现在偶然发现了几个消息来源,指出以这种方式使用豪斯曼检验实际上被误解了,而是测试了组间效应和组内效应是否不同。例如:

Snijders, TA 和 Bosker, RJ (2011)。多级分析:介绍基本和高级多级建模。智者。

Bell, A.、Fairbrother, M. 和 Jones, K.(2019 年)。固定和随机效应模型:做出明智的选择。质量与数量,53(2),1051-1074。

作者指的是 2004 年的一篇文章:

菲尔丁,A.(2004 年)。豪斯曼检验的作用以及更高水平的影响是否应视为随机或固定。多级模型。新闻。16(2),3-9。

但是,有一些相对较新的教科书将 Hausman 检验视为在固定效应和随机效应之间做出决定的工具,例如:

伍德里奇,JM(2010)。横截面和面板数据的计量经济学分析。麻省理工学院出版社。

有人可以帮我摆脱困惑吗?

2个回答

豪斯曼检验所做的是检验固定效应和随机效应模型的结果(即估计系数)是否显着不同。

(我从未见过有人谈论它测试固定效应和“间”效应是否不同,尽管因为随机效应模型被估计为间效应和固定效应模型的加权平均值,你可以看一下方式,我想。)

但是,它用于“在固定效应与随机效应之间做出决定”的原因是,如果两个模型的结果不同,那么这就是更喜欢固定效应模型的原因。

这就是为什么。

固定效应 (FE) 模型解释了较高“组”级别变量的所有遗漏变量偏差,因为固定效应模型基本上只包括每个“组”的虚拟指标变量。这意味着,如果您运行 FE 模型,则不必担心组级别的遗漏变量偏差。

随机效应 (RE) 模型不会自动考虑所有组级别偏差(即,由于“组间”差异而导致的偏差),尽管它允许您包含组级别预测变量(即,仅在组之间变化的预测变量,但不在组内)这样做。现在,如果您要在随机效应模型中包含所有显着的组级协变量,那么您将得到与 FE 模型相同的答案(就较低级别的系数而言)(或者更确切地说,这两个答案将作为样本量相互接近去无穷大)。但RE模型的标准误会更小。

这意味着如果 FE 和 RE 模型的系数基本相同,你应该更喜欢 RE 的,因为它们的标准误差更小,但如果它们不同,你应该更喜欢 FE 的,因为它们不同表明RE模型没有考虑(但FE模型有)的较高水平的遗漏变量偏差。所以这就是为什么我们使用 Hausman 检验来查看系数是否不同,如果测试表明它们不同,我们默认使用 FE 模型。

现在,我要指出,在“现实生活”中,我们可以根据许多其他标准在这两种模型之间进行选择。有时我们关心的自变量处于较高级别,在这种情况下我们不能使用 FE 模型,因为在 FE 模型中您不能包含任何组级预测变量(因为它们与虚拟变量共线)。因此,仅当您有其他实质性理由更喜欢一种模型而不是另一种时,才适合进行 Hausman 检验。

而且我还要注意,根据我的经验,豪斯曼检验几乎总是显着的:也就是说,它几乎总是告诉你两个模型存在显着差异,即使这种差异很小以至于没有实质意义。所以,就像统计数据一样:不要只是盲目地遵循测试结果。

假设 Hausman 检验支持固定效应模型。为什么您仍然对使用随机效应模型感兴趣?随机效应或多级模型允许在建模中具有一定程度的灵活性,这更加混乱,并且在某些情况下无法在固定效应模型中实现。示例包括:

  1. 较低级别变量与结果之间关联的随机斜率,可让您调查组内关联是否因组而异。一个典型的例子是增长曲线建模,其中允许结果的线性(或二次)变化率(由连续时间变量编码)在个体或群体之间变化。在固定效应模型中,您可以通过将较低级别的变量与集群虚拟变量进行交互来粗略地解决这个问题。如果你有很多组,你就会有很多互动。
  2. 与上述相关,随机效应模型允许层内和层间预测变量之间的交互,有时称为跨层交互。在随机效应模型中研究这些需要三个参数 - 较低级别预测变量的随机斜率、随机斜率和随机截距之间的协方差以及交互作用的固定效应项。这不可能在固定效应建模框架中进行调查,因为所有集群级别的变量都被丢弃了。
  3. 调查低级变量的不同内联和间联。这里的兴趣是调查集群内关联是否不同于集群间关联。这有时称为上下文效果建模,还允许您识别辛普森悖论的案例。一个例子是运动与心脏病发作之间的关联。在锻炼时,心脏病发作的风险较高,但平均而言,经常锻炼的人患心脏病的风险往往较低。相关地,在集群中添加较低级别变量的均值可以解决级别 1 的内生性问题,这通常被用作首选固定效应模型的原因。
  4. 预测 - 随机效应模型采用随机截距和斜率的经验贝叶斯预测。这很好,因为该过程纠正了该组预测的可靠性。较小的组被拉向样本平均预测。