使用 R 进行时间序列横截面预测

机器算法验证 r 时间序列 预测 面板数据 负二项分布
2022-04-15 18:14:06

我有一个(我怀疑)简单的问题。我有关于欧盟理事会投票行为的时间序列横截面数据(从 1999 年到 2007 年每个成员国的每月赞成、反对和弃权数)。所以基本上变量是计数,因此泊松/负二项式回归将是合适的,可能在右侧使用滞后因变量来控制时间依赖性。我见过有人使用这种负二项式模型来预测的论文,例如未来每月通过的立法法案的数量,我在这方面有三个问题:

  1. 如何在不犯任何推理错误的情况下对面板数据进行负二项式回归?

  2. 如何使用具有滞后的负二项式模型来预测因变量的未来值。

  3. 这可以在R中完成吗?

托马斯

2个回答

经过一番研究,我可以给出部分答案。在他的书中 ,Wooldridge 讨论了横截面和面板数据的泊松和负二项式回归。但是对于滞后变量的回归,他只讨论了泊松回归。也许在新版本中讨论了负二项式。主要结论是,对于具有滞后随机变量的随机效应泊松回归,可以通过混合效应泊松回归模型进行估计。详细描述可以在这里找到。可以使用包lme4中的glmer估计 R 中的混合效应泊松回归要使其适应面板数据,您需要显式创建滞后变量。然后你的估计命令应该是这样的:

glmer(y~lagy+exo+(1|Country),data,family=quasipoisson)

您还应该查看@dickoa建议的 gplm 包但一定要检查它是否支持滞后变量。gplm 和 plm 包的创建者 Yves Croissant 编写了精彩的代码,但不幸的是,根据我的个人经验,代码没有经过足够的测试,因此 bug 比标准 R 包更频繁地出现。

也许你可以看看pglm包(来自 plm 的同一作者),使用家庭negbin您也可以从贝叶斯的角度尝试 MCMCglmm 包。