如果我们使用未知偏差进行负二项式 GLM,则常用策略(例如在 Rglm.nb中的包MASS中使用)是使用 Gibbs 采样器:
- 保持离散度固定,估计平均值
- 保持均值固定,估计离散度
与泊松回归猜测的平均值不一样吗?如果是这样,为什么还要使用 Gibbs 采样器呢?为什么不使用泊松拟合均值,然后拟合色散?
如果我们使用未知偏差进行负二项式 GLM,则常用策略(例如在 Rglm.nb中的包MASS中使用)是使用 Gibbs 采样器:
与泊松回归猜测的平均值不一样吗?如果是这样,为什么还要使用 Gibbs 采样器呢?为什么不使用泊松拟合均值,然后拟合色散?
它不一样,但它可以接近。在此示例中,偏移量和指数在泊松和负二项式估计之间的距离小于泊松离散度估计值为 1.08,而负二项式估计值为 1.09
代码:
library(ggplot2)
library(data.table)
library(MASS)
data=data.table(x=1:100)
data[,mu:=5*x]
data[,y:=rnbinom(100, mu = mu, size=1)]
lmp=glm(y~log(x),data=data,family=poisson(link="log"))
data[,pred.poisson:=predict(lmp,type="response")]
disp.pois=data[,theta.ml(y,mu,.N)]
lmnb=glm.nb(y~log(x), data=data, link="log")
data[,pred.nb:=predict(lmnb,type="response")]
ggplot(data)+geom_point(aes(x,y))+geom_line(aes(x,mu,colour="true mean"))+
geom_line(aes(x,pred.poisson,colour="poisson"))+
geom_line(aes(x,pred.nb,colour="nb"))