报告带有限制三次样条的逻辑回归中预测变量的影响

机器算法验证 r 回归 物流 样条 回归策略
2022-03-26 08:13:42

我一直在使用 RMS 包使用受限三次样条。下面输出。

library(rms)    
nlmodel_ni_bi_4 <- lrm(outcome~ rcs(age,4) + ethnicity + AV + sex + nb, data=df)
nlmodel_ni_bi_4

Frequencies of Missing Values Due to Each Variable

       outcome           age          ethnicity       AV_binary          poisex      n_charge_binary 
          0               0            3896               0              12               0 

Logistic Regression Model

 lrm(formula = outcome ~ rcs(age, 4) + ethnicity + 
     AV + sex + nb, data = df)


                       Model Likelihood     Discrimination    Rank Discrim.    
                          Ratio Test           Indexes           Indexes       
 Obs         62364    LR chi2    4200.40    R2       0.112    C       0.690    
  0          52455    d.f.             7    g        0.719    Dxy     0.380    
  1           9909    Pr(> chi2) <0.0001    gr       2.052    gamma   0.386    
 max |deriv| 2e-11                          gp       0.100    tau-a   0.102    
                                            Brier    0.123                     

                           Coef    S.E.   Wald Z Pr(>|Z|)
 Intercept                 -7.2339 0.3149 -22.97 <0.0001 
 age                        0.4079 0.0239  17.05 <0.0001 
 age'                      -0.6351 0.0483 -13.15 <0.0001 
 age''                      2.4672 0.2589   9.53 <0.0001 
 ethnicity=NI              -0.6664 0.0299 -22.31 <0.0001 
 AV=1                       0.6583 0.0252  26.14 <0.0001 
 sex=M                      0.2920 0.0274  10.67 <0.0001 
 nb=1                       1.1922 0.0244  48.82 <0.0001 

我习惯于运行逻辑回归,其中所有预测变量都是连续线性或分类的。在这里,当描述个体预测变量对结果的影响时,我们将提供调整后的优势比、相关的 p 值,有时还提供相对风险。我不确定如何在我当前的 RCS 模型中报告年龄预测器。我在一些问题上迷失了:

  1. 与输出中的年龄变量(年龄、年龄'、年龄'')相关联的三个术语究竟是什么。这是导数和导数的导数吗?或者它是每个已安装结的术语?

  2. 使用线性项,调整后的优势比具有简单的解释,具有一致的斜率。鉴于 RCS 不是线性的,描述其效果的推荐方式是什么?

  3. 是否有关于如何报告符合样条曲线的预测变量的指南?

谢谢

1个回答

我的课程笔记描述了受限三次样条函数的组成部分,并提供了在包含一般平滑效果时解释模型的方法。您可以在两个选定的年龄点计算优势比(summary.rms函数中的默认值为四分位数),或者更好:显示部分效应图以描绘整个年龄效应。您还可以使用plot(nomogram(fit))为整个模型构建列线图。不要试图解释个别术语。

诸如“年龄”之类的术语表示立方体中的差异,这些差异将年龄函数限制为超出外部节点的线性。