不平衡数据或平衡数据

机器算法验证 面板数据
2022-03-14 13:35:51

不平衡面板在经济领域更为常见,如果我想了解企业的​​行为,使用不平衡数据面板会有什么区别。有优势吗?它取决于分析的周期吗?还是使用平衡面板会更好?

谢谢!

2个回答

差异通常更多是与所涉及的矩阵代数有关的历史性质。然而,当计量经济学在过去必须用纸笔完成时,这只是一个问题,而今天这些技术性几乎无关紧要。StasK 在较早的答案中提供了对此的讨论,您可以在此处找到。

不平衡面板数据的主要问题是数据不平衡的问题。如果观察结果随机丢失,那么这不是问题 - 要很好地解释“随机丢失”的含义,请查看 Peter Flom 的这个答案如果您的数据中公司随时间的流失不是随机的,即它与特殊错误有关uit,那么这个样本选择可能会使您的估计产生偏差。有关此类案例的示例,请参见此处(Wooldridge 的介绍性教科书,该示例还与您的案例中的公司的面板数据有关)。

Nijman 和 Verbeek (1992)为固定效应模型和随机效应模型提出了对这种样本选择的简单测试。生成选择指示器sit如果在给定年份观察到一家公司,则该值为 1,否则为 0。添加滞后选择指示器si,t1到您的模型并使用整个数据通过固定效应对其进行估计。然后你测试是否si,t1很重要。假设是错误uit与滞后选择指标不相关,因此si,t1应该是微不足道的,才能得出损耗是随机的结论。

如果您想了解有关此主题的更多信息,Wooldridge (2010) “横截面和面板数据的计量经济学分析”用一整章(第 19 章)来介绍样本选择和损耗。

最好使用所有可用数据。如果您的数据不平衡,那么删除数据以使面板平衡并不酷。相反,您应用处理不平衡面板的方法。