R in Action (Kabacoff, 2011) 建议使用以下例程来测试逻辑回归中的过度分散:
使用二项分布拟合逻辑回归:
model_binom <- glm(Species=="versicolor" ~ Sepal.Width,
family=binomial(), data=iris)
使用拟二项分布拟合逻辑回归:
model_overdispersed <- glm(Species=="versicolor" ~ Sepal.Width,
family=quasibinomial(), data=iris)
使用卡方检验过度离散:
pchisq(summary(model_overdispersed)$dispersion * model_binom$df.residual,
model_binom$df.residual, lower = F)
# [1] 0.7949171
有人可以解释这里如何以及为什么使用卡方分布来测试过度分散吗?p 值为 0.79 - 这如何表明过度分散在二项分布模型中不是问题?