用偏移量预测 GLM 泊松

机器算法验证 r 广义线性模型 预言 抵消
2022-03-05 18:58:19

我知道这可能是一个基本问题......但我似乎找不到答案。

我正在用泊松族拟合 GLM,然后尝试查看预测,但是似乎确实考虑了偏移量:

model_glm=glm(cases~rhs(data$year,2003)+lhs(data$year,2003),
offset=(log(population)), data=data, subset=28:36, family=poisson())

predict (model_glm, type="response")

我得到的是案件而不是费率...

我也试过

model_glm=glm(cases~rhs(data$year,2003)+lhs(data$year,2003)+
offset(log(population)), data=data, subset=28:36, family=poisson())

结果相同。但是,当我使用 mgcv 从 GAM 进行预测时,预测会考虑偏移量(我得到速率)。

我错过了什么?

1个回答

由于您正在预测病例,因此获取病例而不是费率是正确的。如果您想获得比率,您应该在所有列都等于数据但总体列相同等于 1 的新数据集上使用预测方法,因此 log(populaton)=0。在这种情况下,您将得到一个单位人口的病例数,即比率。