为什么指数逻辑回归系数被视为“优势比”?

机器算法验证 回归 物流 罗吉特
2022-03-24 15:01:46

逻辑回归将事件的对数几率建模为一组预测变量。也就是说,log(p/(1-p)) 其中 p 是某个结果的概率。因此,某些变量 (x) 的原始逻辑回归系数的解释必须在对数优势尺度上。也就是说,如果 x = 5 的系数,那么我们知道 x 对应的 1 个单位变化对应于结果将发生的对数几率尺度上的 5 个单位变化。

但是,我经常看到人们将指数逻辑回归系数解释为优势比。但是,显然 exp(log(p/(1-p))) = p/(1-p),这是一个赔率。据我了解,优势比是一个事件发生的几率(例如,事件 A 的 p/(1-p))与另一事件发生的几率(例如,事件的 p/(1-p)乙)。

我在这里想念什么?似乎这种对指数逻辑回归系数的常见解释是不正确的。

2个回答

在我看来,@Laconic 的回答很棒而且很完整。我想补充的是,原始系数描述了预测变量中相差 1 的两个单位的对数几率差异。例如,对于上相差1 的两个单位之间的对数几率差异为 5。在数学上,XX

β=log(odds(p|X=x0+1))log(odds(p|X=x0))

当你对取幂时,你得到β

exp(β)=exp(log(odds(p|X=x0+1))log(odds(p|X=x0)))=exp(log(odds(p|X=x0+1)))exp(log(odds((p|X=x0)))=odds(p|X=x0+1)odds(p|X=x0))

这是一个优势比,一个优势比。

考虑两组条件,第一个由自变量描述,第二个由向量描述,仅在第 i 个变量和一个单位上不同。像往常一样是模型参数的向量。XXxiβ

根据逻辑回归模型,第一种情况下事件发生的概率为,因此事件发生的几率为p1=11+exp(Xβ)p11p1=exp(Xβ)

第二种情况下事件发生的概率是,所以事件发生的几率是p2=11+exp(Xβ)p21p2=exp(Xβ)=exp(Xβ+βi)

因此,第二种情况的赔率与第一种情况的赔率之比为因此,将参数的指数解释为优势比。exp(βi)