豪斯曼检验所做的是检验固定效应和随机效应模型的结果(即估计系数)是否显着不同。
(我从未见过有人谈论它测试固定效应和“间”效应是否不同,尽管因为随机效应模型被估计为间效应和固定效应模型的加权平均值,你可以看一下方式,我想。)
但是,它用于“在固定效应与随机效应之间做出决定”的原因是,如果两个模型的结果不同,那么这就是更喜欢固定效应模型的原因。
这就是为什么。
固定效应 (FE) 模型解释了较高“组”级别变量的所有遗漏变量偏差,因为固定效应模型基本上只包括每个“组”的虚拟指标变量。这意味着,如果您运行 FE 模型,则不必担心组级别的遗漏变量偏差。
随机效应 (RE) 模型不会自动考虑所有组级别偏差(即,由于“组间”差异而导致的偏差),尽管它允许您包含组级别预测变量(即,仅在组之间变化的预测变量,但不在组内)这样做。现在,如果您要在随机效应模型中包含所有显着的组级协变量,那么您将得到与 FE 模型相同的答案(就较低级别的系数而言)(或者更确切地说,这两个答案将作为样本量相互接近去无穷大)。但RE模型的标准误会更小。
这意味着如果 FE 和 RE 模型的系数基本相同,你应该更喜欢 RE 的,因为它们的标准误差更小,但如果它们不同,你应该更喜欢 FE 的,因为它们不同表明RE模型没有考虑(但FE模型有)的较高水平的遗漏变量偏差。所以这就是为什么我们使用 Hausman 检验来查看系数是否不同,如果测试表明它们不同,我们默认使用 FE 模型。
现在,我要指出,在“现实生活”中,我们可以根据许多其他标准在这两种模型之间进行选择。有时我们关心的自变量处于较高级别,在这种情况下我们不能使用 FE 模型,因为在 FE 模型中您不能包含任何组级预测变量(因为它们与虚拟变量共线)。因此,仅当您有其他实质性理由更喜欢一种模型而不是另一种时,才适合进行 Hausman 检验。
而且我还要注意,根据我的经验,豪斯曼检验几乎总是显着的:也就是说,它几乎总是告诉你两个模型存在显着差异,即使这种差异很小以至于没有实质意义。所以,就像统计数据一样:不要只是盲目地遵循测试结果。