逻辑回归的偏差分布

机器算法验证 物流 数据转换 越轨
2022-04-01 13:55:55

我想知道逻辑回归如果做不到这一点,有没有办法将它们转换为近似正态分布的 rv?di

我的数据生成过程模型是最简单的模型,例如

yiB(pi)

在哪里

pi=xxiθθ

\ mathcal是伯努利分布。B

所以在R代码中:

n<-1000
p<-5
x<-matrix(rnorm(n*(p-1)),nc=p-1);
y<-cbind(1,x)%*%rep(1,p)
y0<-1/(exp(-y)+1);
y0<-rbinom(n,1,y0)

fit<-glm(y0~x,family="binomial")
y<-residuals(fit,type="deviance")
qqnorm(y)
qqline(y)
1个回答

如果您的个人二项式分母足够大,偏差残差大致呈正态分布。这是残差具有卡方分布的共同假设的基础,其中 df 等于模型的残差 df。基本上,这些结果背后的理论对于是渐近的。niDni

但是,如果您的很小,则该理论不再成立。特别是,对于二进制数据,各个都是 1,并且残差根本没有合理的分布——它们只是两个集群,对应于在这种情况下,基于残差的诊断不是很有用,除非您可以以某种方式聚合您的数据以使每个大。niniy=01ni