从逻辑回归系数制作预测方程

机器算法验证 r 物流
2022-03-31 10:33:22

我在 R 中创建了一个逻辑回归,并希望使用经过训练的模型来创建一个预测函数(比如说在 Excel 中)。如何将系数转换为预测方程?

glm(formula = is_bad ~ is_rent + dti + bc_util + open_acc +    pub_rec_bankruptcies + 
chargeoff_within_12_mths, family = binomial, data = df)

Deviance Residuals: 
    Min       1Q   Median       3Q      Max  
-0.8659  -0.5413  -0.4874  -0.4322   2.4289  

Coefficients:
                            Estimate Std. Error  z value Pr(>|z|)    
(Intercept)              -2.9020574  0.0270641 -107.229  < 2e-16 ***
is_rentTRUE               0.3105513  0.0128643   24.141  < 2e-16 ***
dti                       0.0241821  0.0008331   29.025  < 2e-16 ***
bc_util                   0.0044706  0.0002561   17.458  < 2e-16 ***
open_acc                  0.0030552  0.0012694    2.407   0.0161 *  
pub_rec_bankruptcies      0.1117733  0.0163319    6.844 7.71e-12 ***
chargeoff_within_12_mths -0.0268015  0.0564621   -0.475   0.6350    
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

(Dispersion parameter for binomial family taken to be 1)

Null deviance: 173006  on 233017  degrees of freedom
Residual deviance: 170914  on 233011  degrees of freedom
(2613 observations deleted due to missingness)
AIC: 170928

Number of Fisher Scoring iterations: 4
1个回答

不幸的是,您似乎运行的不是逻辑回归模型。请注意,线性回归(即,具有正态分布的残差)是广义线性模型的一个特例。默认情况下,R假设调用glm()请求。你可以看到你在输出的底部看到了“高斯族的色散参数......”。要获得逻辑回归拟合,您需要添加参数family=binomial

根据您所拥有的,预测方程将是:

is_bad=0.05693+0.03428 is_rentTRUE+0.002879 dti+εwhere εN(0,0.10657422)

现在,假设您已将上述参数包含在函数调用中(即glm(is_bad~is_rent+dti, data=df, family=binomial))。然后我们可以说明如何在粘贴的输出中转换相同的数字。(请注意,当您返回并执行此操作时,它们实际上将是不同的数字,而且,数字/系数将有不同的解释!)

在这种情况下,我们可以首先认识到系数用于重新创建我们所说的“线性预测器”。使用它,我们可以进一步构建预测方程:

linear predictor=0.05693+0.03428 is_rentTRUE+0.002879 dtip(is_bad=TRUE)=exp(linear predictor)1+exp(linear predictor)

对于解释R逻辑回归的输出(包括系数的解释)的更一般参考,阅读我的答案可能会有所帮助:二项式回归的 R 输出解释


更新: 我们现在可以使用您更新的模型拟合来获得您想要的方程。

线性预测器=-2.9020574+0.3105513 is_rentTRUE +0.0241821 dti +0.0044706 bc_util +0.0030552 open_acc+0.1117733 pub_rec_bankruptcies +-0.0268015 Chargeoff_within_12_mthsp(不好=真的)=经验(线性预测器)1+经验(线性预测器)