为什么逻辑回归不需要残差的异方差性和正态性,也不需要线性关系?

机器算法验证 物流 多重回归 线性模型 假设
2022-03-21 13:13:40

当我试图理解时,我正在阅读这个链接。甚至《计量经济学入门》中的 Wooldridge 或 Scratch 的 O'Reilly 数据科学都没有探讨过这个问题。我很惊讶我找不到这个问题的任何解释。因此,问题与逻辑回归假设有关。为什么逻辑回归不需要线性回归所需的误差和线性关系假设?

我会尝试更好地解释,但如果问题变得混乱,标题就是简短的问题和我脑海中的东西......所以,我知道逻辑回归是关于类别目标的,但回归实际上预测概率一个事件/类别,对吧?那不是需要线性关系吗?

关于错误,不需要正态性假设,因为错误将为零或 1?我认为需要一些假设,所以我们不会有任何偏见(例如:我们有一个 logit 来预测是否有人会偿还债务,但我们的模型让大多数纽约人的预测都是正确的,但不是来自新泽西州,idk) .

好吧,我认为我的问题有点混乱,因为我试图更好地解释,但希望人们会理解,并且这些假设会比我们拥有的大多数教程得到更多探索。

提前致谢

1个回答

那不是需要线性关系吗?

假设是协变量的影响在对数优势尺度上是线性的。你可能会看到逻辑回归写成

logit(p)=Xβ

这里,logit(p)=log(p1p). 此外,请记住线性并不意味着 GLM 中的直线。

关于错误,不需要正态性假设,因为错误将为零或 1?

不完全的。逻辑回归估计一个概率,误差(意思是观察减去预测)将在 0 和 1 之间。

为什么逻辑回归不需要线性回归所需的误差和线性关系假设?

逻辑回归仍然是一个线性模型,它只是在不同的空间中是线性的,以尊重约束0p1. 至于您关于误差项及其方差的名义问题,请注意二项式随机变量的方差取决于其均值(Var(X)=np(1p))。因此,方差机会随着平均值的变化而变化,这意味着方差(技术上)是异方差的(即非恒定的,或者至少根据什么变化X是因为p变化基于X)。