广义线性模型的假设

机器算法验证 物流 广义线性模型
2022-03-19 03:08:59

在“应用回归的 R 伴侣”的第 232 页上,Fox 和 Weisberg 注释

只有高斯族具有恒定方差,而在所有其他 GLM 中,y 在 x 处的条件方差取决于 μ(x)

早些时候,他们注意到泊松的条件方差是 μ,而二项式的条件方差是 μ(1μ)N

对于高斯,这是一个熟悉且经常检查的假设(同方差性)。同样,我经常看到作为泊松回归假设讨论的泊松条件方差,以及违反它的情况(例如负二项式、零膨胀等)的补救措施。然而,我从未将二项式的条件方差视为逻辑回归中的假设。一点谷歌搜索没有发现任何提及它。

我在这里想念什么?

在@whuber 的评论之后编辑:

正如建议的那样,我正在浏览 Hosmer & Lemeshow。这很有趣,我认为它说明了为什么我(也许还有其他人)感到困惑。例如,“假设”一词不在该书的索引中。此外,我们有这个(第 175 页)

在逻辑回归中,我们必须主要依赖视觉评估,因为模型拟合假设下的诊断分布仅在某些有限的环境中已知

它们显示了很多图,但集中在各种残差与估计概率的散点图上。这些图(即使对于一个好的模型,在 OLS 回归中也没有类似图的“斑点”模式特征,因此更难判断。此外,它们与分位数图没有任何相似之处。

在 R 中,plot.lm 提供了一组很好的默认图来评估模型;我不知道逻辑回归的等价物,尽管它可能在某些包中。这可能是因为每种类型的模型都需要不同的图。SAS 确实在 PROC LOGISTIC 中提供了一些图。

这当然似乎是一个潜在的混乱领域!

2个回答

这些图(即使对于一个好的模型,在 OLS 回归中也没有类似图的“斑点”模式特征,因此更难判断。此外,它们与分位数图没有任何相似之处。

DHARMa R 包通过模拟拟合模型将任何 GL(M)M 的残差转换为标准化空间来解决此问题。一旦完成,所有用于视觉和形式评估残差问题的常规方法(例如 qq 图、过度离散、异方差、自相关)都可以应用。请参阅包小插图以获取经过处理的示例。

关于@Otto_K 的评论:如果同质过度分散是唯一的问题,那么使用观察级随机效应可能更简单,可以使用标准二项式 GLMM 来实现。但是,我认为@PeterFlom 也关注异方差性,即色散参数与一些预测变量或模型预测的变化。这不会被标准的过度分散检查/校正拾取/校正,但您可以在 DHARMa 残差图中看到它。为了纠正它,在 JAGS 或 STAN 中将色散建模为其他东西的函数可能是目前唯一的方法。

您解释的主题通常称为过度分散在我的工作中,我看到了此类主题的可能解决方案:

使用贝叶斯方法,并估计 Beta-Binomial 分布。这对于其他分布(由其他先验引起)具有很大的优势,具有封闭形式的解决方案。

参考: