计数数据的泊松回归 - 预测

机器算法验证 r 广义线性模型 泊松分布 预言
2022-03-04 15:37:50

这可能是我的理解或 R 实现中的一个基本错误:我正在尝试使用泊松模型进行一些预测。原始数据是离散计数数据。我希望预测也是离散的结果(例如 39、40、41)。相反 - 预测包括小数(41.2) - 这对于计数预测/泊松分布来说似乎很奇怪。我究竟做错了什么?

例子:

warpbreaks
breaksmodel<-glm(breaks~wool*tension, warpbreaks, family=poisson)
predict(breaksmodel,warpbreaks,type="response") 
1个回答

泊松模型的预测是泊松分布的平均参数,它不限于整数。(想想旧的“平均家庭有 2.4 个孩子”的难题。)使用这些预测均值的模型模拟结果当然是整数:对于预测均值 41.2 的预测变量组合,您可能会得到 45、39、42 , 或 40 作为模拟结果。