具有对数偏移的二进制模型(Probit 和 Logit)

机器算法验证 罗吉特 概率 对数 抵消
2022-03-15 21:54:44

有没有人推导出偏移量在 probit 和 logit 等二进制模型中的工作原理?

在我的问题中,后续窗口的长度可能会有所不同。假设患者接受预防性注射作为治疗。注射发生在不同的时间,因此,如果结果是是否发生任何突发事件的二元指标,则您需要针对某些人有更多时间表现出症状的事实进行调整。似乎突然发作的概率与随访期的长度成正比。在数学上,我不清楚具有偏移量的二元模型如何捕捉这种直觉(与泊松不同)。

偏移量是Stata (p.1666)R中的标准选项,我可以很容易地看到Poisson,但二进制情况有点不透明。

例如,如果我们有

E[y|x]Z=exp{xβ},
这在代数上等价于一个模型,其中
E[y|x]=exp{xβ+logZ},
这是系数为的标准模型logZ受限于1. 这称为对数偏移如果我们更换,我无法弄清楚这是如何工作的exp{}Φ()或者Λ().

更新#1:

下面解释了 logit 案例。

更新#2:

这是对诸如 probit 之类的非泊松模型的偏移的主要用途的解释。偏移量可用于对指数函数系数进行似然比检验。首先,您估计无约束模型并存储估计值。假设您想检验以下假设βx=2. 然后创建变量z=2x, 拟合模型x并使用z作为非对数偏移。这是约束模型。LR 测试将两者进行比较,是通常 Wald 测试的替代方法。

2个回答

您始终可以在任何GLM 中包含偏移量:它只是一个系数固定为 1 的预测变量。泊松回归恰好是一个非常常见的用例。

请注意,在二项式模型中,对数曝光作为偏移量的模拟只是二项式分母,因此通常不需要明确指定它。正如您可以将泊松 RV 建模为以对数曝光作为偏移量的计数,将曝光作为权重的比率一样,您可以类似地将二项式 RV 建模为成功和失败的计数,或者作为试验的频率作为一个重量。

在逻辑回归中,您将解释logZ优势比方面的抵消:比例变化Z导致给定的比例变化p/(1p).

log(p/(1p))=βX+logZp/(1p)=Zexp(βX)

但这并没有像对数曝光在泊松回归中那样具有任何特殊意义。也就是说,如果您的二项式概率足够小,逻辑模型将接近具有对数链接的泊松模型(因为 LHS 上的分母接近 1),并且偏移量可以视为对数曝光项。

(您链接的 R 问题中描述的问题相当特殊。)

将其重新定义为事件时间问题,具有 ln(time) 偏移量的逻辑模型不会有效地将您提交给可能适合或不适合数据的参数生存函数吗?

p/(1p)=Zexp(xbeta)

p=[Zexp(xbeta)]/[1+Zexp(xbeta)]

时间Z=1[Zexp(xbeta)]/[1+Zexp(xbeta)]