我有一个面板数据,我在其中观察了 1500 家公司,许多人在这些公司工作了多个时期。我在个人(例如种族、年龄、教育)和公司层面(例如公司年龄、研发投资、广告支出、行业)都有解释变量。所以有不同类型的解释变量,即连续的、分类的、二元的。在这个数据集中,同一个人可能同时为不止一家公司工作(假设其中一些是顾问)。我的因变量是每年的销售额。
通过使用这些数据,我想对因变量进行预测,并想测试每个解释变量的重要性。有谁知道哪些模型更合适,我在哪里可以找到关于这个主题的可靠材料?我正在考虑将 RNN 应用于面板数据(如何做?),但也对其他建议持开放态度。
我知道 ML 和计量经济学仍然没有就因果关系相互交谈,但你知道最近有什么与这个问题相关的论文/发展吗?