如何对零膨胀、过度分散的泊松时间序列进行建模?

机器算法验证 时间序列 泊松分布 自相关 过度分散 无游戏
2022-03-24 02:43:54

我试图模拟一个国家在 10 年内受温度影响的 25 个不同地区的每周疾病计数。数据是零膨胀和过度分散的。

我最熟悉 Stata,但我认为在 , 等命令中没有任何选项gee可以xtmixedxtmepoisson我考虑零通货膨胀和过度分散问题以及自相关问题。

我对发病率数据进行了对数转换并使用了 SARIMA 模型,但残差不太正常。我认为有用于疾病计数等整数数据的 ARIMA 模型版本,但我找不到适用于它的程序。

我还认为我可以创建一个分层模型,其中包含每个区域的随机截距和每个区域温度的随机影响,同时还考虑了常规的季节性疾病周期。我相信我可以使用glmm.admb 之类的包在 R 中对此进行建模,但由于我的统计和 R 知识有限,我并不完全确定如何使用它。我主要对使用这样的程序来解释数据的自相关和季节性周期部分感到困惑。

关于如何最好地做到这一点的任何建议?

3个回答

您可能想hurdle()psclR 中的包中签出。它指定了两个组件模型,一个处理零计数,一个处理正计数。在此处查看hurdle帮助页面

编辑:我刚刚在 R 帮助中找到了这篇文章,它描述了 R 中的zeroinf()函数(也来自 pscl 包)以及gamlss选项VGAM但是,我认为这些VGAM选项不会允许您考虑非独立的相关结构。

另一种选择是zinbStata 中的命令。使用负二项式系列拟合模型将解释过度分散。

但是,我不确定他们是否允许进行季节性调整。

R 中负二项式回归的另一个选择是出色的 MASS 包的glm.nb()功能。UCLA 的统计咨询小组有一个非常清晰的小插图,不幸的是,它似乎没有为您的自相关问题提供任何明显的见解,但也许在 R-seek 或其他地方搜索这些不同的 nb-regression 选项会有所帮助?

如果您有权访问 SAS 9.2,则可以使用 PROC COUNTREG。这是一个相当新的过程,如果您浏览 SAS 站点,您可以在 SAS/ETS(R) 9.2 User's Guide 中找到有关它的信息。COUNTREG 确实计算有或没有零通货膨胀的建模,有一个“by”子句来拆分分析,并允许分类变量和连续变量。