为什么在负二项式glm中迭代估计色散

机器算法验证 广义线性模型 负二项分布 分散
2022-04-13 11:28:32

如果我们使用未知偏差进行负二项式 GLM,则常用策略(例如在 Rglm.nb中的包MASS中使用)是使用 Gibbs 采样器:

  1. 保持离散度固定,估计平均值
  2. 保持均值固定,估计离散度

与泊松回归猜测的平均值不一样吗?如果是这样,为什么还要使用 Gibbs 采样器呢?为什么不使用泊松拟合均值,然后拟合色散?

1个回答

它不一样,但它可以接近。在此示例中,偏移量和指数在泊松和负二项式估计之间的距离小于泊松离散度估计值为 1.08,而负二项式估计值为 1.09103示例图

代码:

library(ggplot2)
library(data.table)
library(MASS)

data=data.table(x=1:100)
data[,mu:=5*x]
data[,y:=rnbinom(100, mu = mu, size=1)]

lmp=glm(y~log(x),data=data,family=poisson(link="log"))
data[,pred.poisson:=predict(lmp,type="response")]
disp.pois=data[,theta.ml(y,mu,.N)]

lmnb=glm.nb(y~log(x), data=data, link="log")
data[,pred.nb:=predict(lmnb,type="response")]

ggplot(data)+geom_point(aes(x,y))+geom_line(aes(x,mu,colour="true mean"))+
  geom_line(aes(x,pred.poisson,colour="poisson"))+
  geom_line(aes(x,pred.nb,colour="nb"))