在对保险环境中的索赔计数数据建模时,我从泊松开始,但后来发现过度分散。Quasi-Poisson 比基本 Poisson 更好地模拟了更大的均值方差关系,但我注意到 Poisson 和 Quasi-Poisson 模型中的系数是相同的。
如果这不是错误,为什么会发生这种情况?使用 Quasi-Poisson 优于 Poisson 有什么好处?
注意事项:
- 潜在的损失是超额的,这(我相信)阻止了 Tweedie 的工作——但这是我尝试的第一个分布。我还检查了 NB、ZIP、ZINB 和 Hurdle 模型,但仍然发现 Quasi-Poisson 提供了最佳拟合。
- 我通过 AER 包中的分散测试测试了过度分散。我的色散参数约为 8.4,p 值为 10^-16 大小。
- 我正在使用 glm() 与 family = poisson 或 quasipoisson 以及代码的日志链接。
- 运行泊松代码时,我会出现“In dpois(y, mu, log = TRUE) : non-integer x = ...”的警告。
根据 Ben 的指导,有用的 SE 线程: