比较计数数据的回归模型

机器算法验证 回归 aic 计数数据 似然比 模型比较
2022-03-25 14:21:40

我最近为相同的预测/响应数据拟合了 4 个多元回归模型。我适合泊松回归的两个模型。

model.pois <- glm(Response ~ P1 + P2 +...+ P5, family=poisson(), ...)
model.pois.inter <- glm(Response ~ (P1 + P2 +...+ P5)^2, family=poisson(), ...)

我拟合负二项式回归的两个模型。

library(MASS)
model.nb <- glm.nb(Response ~ P1 + P2 +...+ P5, ...)
model.nb.inter <- glm.nb(Response ~ (P1 + P2 +...+ P5)^2, ...)

有没有我可以用来比较这些模型的统计测试?我一直在使用 AIC 作为适合度的衡量标准,但 AFAIK 这并不代表实际测试。

3个回答

您可以通过似然比检验将负二项式模型与相应的泊松模型进行比较。泊松模型等价于过离散参数为零的负二项式模型。因此它们是嵌套模型,似然比是有效的。复杂之处在于过度离散参数被限制为非负,即它在逻辑上不能小于零,因此零假设在参数空间的边界上。这意味着您不需要将两倍的对数似然与具有一个自由度的卡方分布进行比较,而是需要将其与由 1 df 的卡方和零点质量的相等部分组成的混合分布进行比较(零自由度的卡方分布)。这在实践中意味着您可以使用 1 df 的卡方计算 p 值,然后将其减半。更多细节和背景,见案例5Self & Liang JASA 1987;82 :605-610。.

请注意,当您拟合负二项式模型时,某些统计软件包(例如 Stata)会自动为您完成这一切。事实上,我从 Stata 帮助系统中无耻地抄袭了上述大部分内容——如果你有 Stata 的话help j_chibar

我相信anova()R 可以用于此。尽管它的名字,它是一个似然比测试。Crawley 在他的 The R Book中有一些使用示例。

正如 onestop 所述,由于模型是嵌套的,因此您可以执行似然比检验。

一般来说,虽然这不是真的,所以如果你想比较非嵌套模型,你可以使用Vuong's test