由于是泊松模型,因变量的期望值与自变量通过对数链接的逆相关,也就是说
E(y)=exp(β0+β1x1+β2x2+β3x1x2)
其中,x1 = 0 如果女性,1 如果男性,x2 = 年龄,并且β0到β3是按 R 输出中显示的顺序估计的系数。
当你有一个零岁的女性时,这里的三个自变量都等于零。因此,零岁女性的预期访问次数为
exp(−1.466168)=0.23
这就是拦截的意义。如果你取它的指数,你会得到基线访问次数,其中基线意味着所有自变量都设置为零。
零岁男性的预期访问次数为
exp(−1.466168−0.801987)=0.10
或者exp(−.801987)=0.45乘以零岁女性的预期访问次数。
随着年龄的增长,女性的预期访问次数会增加 1 倍
exp(0.009322)=1.009或约 1%。
随着年龄的增长,男性的预期访问次数会增加 1 倍
exp(0.009322+0.012186)=1.022或约 2%。
因此,总体而言,与女性相比,您预计新生儿男性的就诊次数约为女性的一半,但预期的就诊次数会随着年龄的增长而增加,大约是女性的两倍。
AIC 孤立地没有帮助。您可以将其与某些替代模型的 AIC 进行比较。粗略地说,在调整参数数量后,具有较低 AIC 的模型具有更好的拟合度。
您可以使用偏差进行拟合优度检验;基本上,无论任何无法解释的变化是否是由于您对泊松分布所期望的那种随机变化造成的。
泊松模型的参数一般没有封闭形式的解;它们必须使用数值方法计算。Fisher 评分迭代告诉优化器必须经过多少次迭代才能将偏差(我认为)最小化到某个可接受的容差范围内。如果迭代次数真的很高,您可能只会担心这一点,这可能指向指定不当的模型(无论如何,您可能会从异常大的参数值和/或标准错误中发现)。