logit - 将系数解释为概率

机器算法验证 可能性 物流 二进制数据 罗吉特 优势比
2022-03-25 00:38:21

我似乎错过了一些重要的信息。我知道逻辑回归的系数以 log(odds) 为单位,称为 logit 标度。因此,为了解释它们,exp(coef)采用并产生 OR,优势比。

如果,则解释如下:对于协变量增加一个单位,对数优势比为 0.012 - 它不能提供有意义的信息。β1=0.012X1

乘幂得出,协变量每增加一个单位,优势比为 1.012(),或者的可能性高 1.012 。X1exp(0.012)=1.012Y=1Y=0

但我想将系数表示为百分比。根据 Gelman 和 Hill 在Data Analysis Using Regression and Multilevel/Hierarchical Models中的说法,第 111 页:

系数 β 可以取幂并被视为乘法效应。”

这样,如果 β1=0.012,那么“预期的乘法增长为 exp(0.012)=1.012,或 1.2% 的正差......

但是,根据我的脚本

ODDS=p1p

和逆 logit 公式状态

P=OR1+OR=1.0122.012=0.502

我很想将其解释为协变量增加一个单位 Y=1 的概率增加了 50%——我认为这是错误的,但我不明白为什么。

如何用概率来解释 logit 系数?

3个回答

这些优势比是相应回归系数的指数:

odds ratio=eβ^

例如,如果逻辑回归系数为,则优势比为β^=0.25e0.25=1.28

优势比是显示 X 值每增加一个单位的优势如何变化的乘数。优势比增加了 1.28 倍。因此,如果初始优势比为 0.25,则协变量增加一个单位后的优势比变为0.25×1.28

尝试解释优势比的另一种方法是查看小数部分并将其解释为百分比变化。例如,优势比 1.28 对应于相应 X 增加 1 个单位的优势增加 28%。

如果我们正在处理递减效应(OR < 1),例如优势比 = 0.94,则相应 X 增加 1 个单位的优势会降低 6%。

公式为:

Percent Change in the Odds=(Odds Ratio1)×100

问题的一部分是你从 Gelman 和 Hill 中断章取义。这是谷歌图书的截图:

在此处输入图像描述

请注意,标题显示“解释泊松回归系数”(添加了重点)。泊松回归使用对数链接,而逻辑回归使用 logit(log-odds)链接。将指数系数解释为乘法效应仅适用于对数尺度系数(或者,如果基线风险非常低,则可能会稍微混淆水域,适用于对数尺度系数......)

每个人都希望能够以一种简单的、通用的、与尺度无关的方式引用处理对概率的影响,但这基本上是不可能的:这就是为什么有这么多解释赔率和对数赔率的教程在野外流传,以及为什么流行病学家花这么多时间争论相对风险与优势比与...

如果你想用百分比来解释,那么你需要 y-intercept (β0)。当所有协变量为 0 时,取截距的指数给出几率,然后您可以乘以给定项的几率比来确定当该协变量为 1 而不是 0 时的几率。

上面的逆 logit 变换可以应用于赔率,以给出概率的百分比Y=1.

所以当所有x=0

p(Y=1)=eβ01+eβ0

而如果x1=1(并且任何其他协变量为0)然后:

p(Y=1)=e(β0+β1)1+e(β0+β1)

这些是可以比较的。但请注意,效果x1因人而异β0,它不是像线性回归那样的恒定效应,仅在对数赔率尺度上是恒定的。

另请注意,您的估计β0将取决于如何收集数据。一项病例对照研究,其中受试者数量相等Y=0Y=1被选中,那么它们的值x观察到可以给出一个非常不同的β0估计比一个简单的随机样本,从第一个百分比(S)的解释可能是没有意义的解释在第二种情况下会发生什么。