机器算法验证 - 为什么在负二项式glm中迭代估计色散 - 吾爱随笔录

为什么在负二项式glm中迭代估计色散

机器算法验证广义线性模型负二项分布分散

2022-04-13 11:28:32

如果我们使用未知偏差进行负二项式 GLM，则常用策略（例如在 Rglm.nb中的包MASS中使用）是使用 Gibbs 采样器：

保持离散度固定，估计平均值
保持均值固定，估计离散度

与泊松回归猜测的平均值不一样吗？如果是这样，为什么还要使用 Gibbs 采样器呢？为什么不使用泊松拟合均值，然后拟合色散？

1个回答

它不一样，但它可以接近。在此示例中，偏移量和指数在泊松和负二项式估计之间的距离小于泊松离散度估计值为 1.08，而负二项式估计值为 1.09 $10^{-3}$

代码：

library(ggplot2)
library(data.table)
library(MASS)

data=data.table(x=1:100)
data[,mu:=5*x]
data[,y:=rnbinom(100, mu = mu, size=1)]

lmp=glm(y~log(x),data=data,family=poisson(link="log"))
data[,pred.poisson:=predict(lmp,type="response")]
disp.pois=data[,theta.ml(y,mu,.N)]

lmnb=glm.nb(y~log(x), data=data, link="log")
data[,pred.nb:=predict(lmnb,type="response")]

ggplot(data)+geom_point(aes(x,y))+geom_line(aes(x,mu,colour="true mean"))+
  geom_line(aes(x,pred.poisson,colour="poisson"))+
  geom_line(aes(x,pred.nb,colour="nb"))

其它你可能感兴趣的问题

上一篇在保持曲线形状的同时减少 excel 中的数据点数量下一篇通过取第 n 个根，“标准化”加入 n 个事件的概率