过度分散泊松或负二项式回归

机器算法验证 r 负二项分布 泊松回归 过度分散 无游戏
2022-03-30 16:24:51

我正在对计数数据(保险索赔)执行 GLM,我希望将过度分散泊松回归 (ODP) 与负二项式回归进行比较。

会知道在标准 R 中是否有一个实用的索引(AIC,logLik)可以支持我拟合使用哪个索引。我正在选择具有向后删除的重要预测因子(使用anova(fittedModel, test="Chisq")III 型测试)。

因此,不假设每个分布族中的最终模型具有相同的预测变量集。

2个回答

您可以使用 NB1 分布,而不是过度分散(或准)泊松回归,它具有与 ODP 相同的线性方差函数和完整的似然函数,而不是 ODP 的拟似然。NB1 在gamlss包 as中实现family=NBII,而常规 Negative Binomial 可以通过 调用family=NBI这部分答案的所有功劳归功于@Achim Zeileis,他在这里帮助我解决了一个类似的问题:为什么glm中的Quasipoisson不被视为负二项式的特例?,请参阅他的帖子以获取有关 NB/NB1(以及令人困惑的命名约定)的更多信息。

关于 ANOVA,我一直无法找到对象的内置方法gamlss,但编写自己的卡方检验统计量实现并不难。一个例子:

set.seed(123)
data = rNBII(100,mu = 6,sigma=0.5)  #generate NB1 data with mean mu=5 and variance (1+sigma)*mu = 9
h0 = gamlss(data~1,family=PO) #null model: poisson
h1 = gamlss(data~1,family=NBII) #alternative model: NB1/ODP

df = h1$df.fit - h0$df.fit
deviance = as.numeric(-2*logLik(h0) + 2*logLik(h1))
p.value = pchisq(deviance,df,lower.tail=F)
> p.value
[1] 0.01429169 #reject the null model at > 95% confidence

我不确定“在标准 R 中”究竟是什么意思,但如果您愿意下载包,我相信pscl包的vuong功能可能会满足您的需求。它实现了专门设计用于比较非嵌套模型的模型比较测试;它也可以比较嵌套的,但是有更熟悉的可以达到这个目的。与大多数其他模型比较测试一样,它基于比较两个模型的可能性。Vuong 测试涉及对简约性等的一些修正。

Wikipedia上提供了一个不错的摘要

这是原始引文:

Vuong,QH(1989 年)。模型选择和非嵌套假设的似然比检验。计量经济学57(2)。307–333。