我有一个密度不同的泊松模型:
set.seed(1)
df = data.frame(density = 1:5, events = rpois(2000, 1:5))
如果我对此进行回归,我会得到截距约为log(3),这是有道理的,因为 3 是 1:5 的平均值。
glm(events ~ 1, df, family = poisson) # returns 1.089
但现在假设我想读回密度系数:
glm(events ~ as.factor(density), df, family = poisson)
(为简单起见,我已将其用作density字段的 ID 及其密度。)我希望系数为density[i],log(3-i)因为截距仍为 3。但是,截距似乎并不保持 3 - 在此情况下,截距设置为log(1)。在玩这个时,似乎 glm 将截距设置为第一个因素的系数。
现在我开始想知道 glm 回归中的 p 值表示什么。零假设density[i]是否与截距(aka density[1])相同?还是那样density[i] = mean(density)?