我正在通过 GLM 在 r 中对索赔严重性建模。我想检查所有预测变量是否都很重要。我对所有预测变量依次使用似然比检验(通过函数 anova())。最后,我得到了简化的模型
> anova(severity,model.severity,test="LRT")
Model 1: claimcst0 ~ gender + area + agecat
Model 2: claimcst0 ~ veh_value + veh_age + veh_body + gender + area +
agecat
Resid. Df Resid. Dev Df Deviance Pr(>Chi)
1 4612 7558.0
2 4596 7488.7 16 69.371 0.09736 .
我们可以看到检验的 p 值大于 0.05。我们不拒绝较小的模型。
但有趣的是,较小的模型具有更大的残差和 AIC。
model A
Residual deviance: 7558.0 on 4612 degrees of freedom
AIC: 85079
model B
Residual deviance: 7488.7 on 4596 degrees of freedom
AIC: 85055
原因是什么?与模型 B 相比,模型 A 仍然是更好的模型吗?