豪斯曼检验:包括或不包括年份效应和/或交互变量

机器算法验证 假设检验 多重回归 面板数据 豪斯曼
2022-03-28 12:05:12

我在执行 Hausman 测试时遇到问题。

我有一个包含五个面板的面板数据集。我对同一个模型进行了两次估计,一次使用季度数据,另一次使用半年数据。

我的因变量和一些解释变量包含时间序列数据,这些数据会随着个人和时间而变化。但是,我也有一次假人、一年和两个与假人的交互项。

年份虚拟变量不会跨面板变化,因为我认为每个面板的年份相同,并且不会随时间系统地变化,因为在季度数据的情况下,每个面板我有同年 4 次,而半年我每个面板有一年两次。像这样的东西

Year | Quarters

1998   1998q1
1998   1998q2
1998   1998q3
1998   1998q4
(...)

在交互项的情况下,值确实会随着个人和时间而变化,但仅在 5 个面板中的 4 个中发生变化,因为对于第一个面板,变量乘以零。因此,第一个面板的所有值都为零。

根据 Wooldridge (2010, p.329) “横截面和面板数据的计量经济学分析”,在关于比较 FE 和 RE 的部分中,他说:

“因为 FE 方法仅识别时变解释变量的系数,我们显然无法比较时间常数变量的 FE 和 RE 系数。但是有一个更微妙的问题:我们不能在比较总时间效应的系数中包括 - - 也就是说,仅在 t 期间变化的变量。(...)比较总时间效应的系数的问题不是识别问题;我们知道 RE 和 FE 都允许包含完整的时间段虚拟变量集。问题是 FE beta 估计和 RE beta 估计之间差异的渐近方差矩阵中的奇异点之一。”

实验后我有以下问题:

1)如果我只使用“纯”变量(无交互)回归,有/没有年份影响,我会得到我在这里询问的错误

2)如果我包括交互术语,一切似乎都很好。但是,当至少在一个面板中其值不随 t 变化时,是否可以包括这些交互项?

3) 包括/不包括年份效应的测试结果是不同的,从某种意义上说,在一种情况下它很重要,而在另一种情况下则不重要。独立于这些结果,我是否应该在模型中包含年份效应(年份虚拟变量),从中获得用于 Hausman 检验的估计值?

1个回答

1)您使用的是hausmanorxtoverid命令吗?您可以尝试使用有时会解决负面测试统计信息hausman的选项的命令。sigmamore负检验统计量可能是由于样本量小,该sigmamore选项将这一点考虑在内。对于 Wooldridge 提出的观点,它也很有用,因为此选项将测试基于干扰方差的共同估计。

2) FE 估计器(当然也不是 RE 估计器)仅在其中一个面板中具有时不变性不是问题。当然,由于 FE 估计器依赖于它,所以在所有面板中都有变化是有帮助的,但识别不需要所有面板的变化范围内。

3)鉴于您的特定研究问题(银行依赖于再次与时间相关的宏观经济因素)并且 FE 和 RE 都可以使用时间虚拟变量,您应该包括时间虚拟变量。Wooldridge 指的是模型之间的比较,其中 RE 模型包含完全时不变的变量,因此不能在 FE 模型中使用 - 这相当于比较两个完全不同的模型。你可能会发现 p。讲座的 4-10很有用,其中讨论了您有关 Hausman 测试的一些问题,包括时间假人等。