连续变量违反 Cox 比例危害

机器算法验证 回归 生存 cox模型 舍恩菲尔德残差
2022-03-28 05:13:03

[此问题与本网站上的12有关。]

我用这三个时间相关变量拟合 Cox 模型:{ s:numeric, C:binary, l:numeric}。我有 1069 个事件,其中大约一半在右删失观察中。

model<- coxph( Surv(start, stop, event) ~ s+ C+  l, data=dat)
                    coef exp(coef) se(coef)    z p
s                   3.32     27.61   0.0825 40.2 0
CTRUE               1.36      3.88   0.1086 12.5 0
l                   0.08      1.08   0.0077 10.4 0

Likelihood ratio test=990  on 3 df, p=0  n= 798431, number of events= 1069 

我检查变量和全局模型的比例风险 (PH) 假设:

cox.zph(model)
                       rho  chisq        p
s                   0.2066 12.536 0.000399
CTRUE               0.0453  2.212 0.136984
l                   0.0461  0.835 0.360842
GLOBAL                  NA 14.684 0.002108

我可以看到这s违反了 PH 假设,从而为全球model.

同样从下面的图中,将估计的回归系数显示为时间的函数,我看到 的系数s看起来很可疑,尤其是我用红色圈出的部分:

在此处输入图像描述

为了解决这个问题,我添加了一个与模型的时间交互s并重新调整模型。但是,如果您查看这些新结果,系数的ps:stop高于我的截止值p= 0.05,因此在统计上不显着(!):

model2<- coxph( Surv(start, stop, event) ~ s+ s:stop + C+  l, data=dat)
                        coef exp(coef) se(coef)     z     p
s                   3.25e+00     25.84 9.32e-02 34.89 0.000
CTRUE               1.36e+00      3.88 1.09e-01 12.49 0.000
l                   7.98e-02      1.08 7.72e-03 10.34 0.000
s:stop              4.42e-05      1.00 2.63e-05  1.68 0.094

Likelihood ratio test=993  on 4 df, p=0  n= 798431, number of events= 1069 

问题 1:有人可以帮我解释我绘制的 Schoenfeld 图,特别是图中的红色区域是什么s意思?

问题2:就目前而言,关于这里发生的事情有什么一般的想法s吗?

PS:我正在阅读下面的论文*以获得更好的洞察力,但更有经验的任何答案都将非常有价值。

*Patricia M Grambsch 和 Terry M Therneau。“基于加权残差的比例危险测试和诊断”,Biometrika,81:515-526,1994。

编辑:

根据@EdM 的评论,我绘制了 s每次的值event,在time=150 - time=700区域之间放大。没有什么特别可疑的。所以实际s值看起来很正常,但拟合给它们的系数相当奇怪。

在此处输入图像描述

1个回答

我认为你已经很好地提出了你的问题。我经常使用扩展的 Cox 模型(具有时变协变量),并且多次遇到相同的障碍。

就像你指出的那样:

cox.zph(model)
                       rho  chisq        p
s                   0.2066 12.536 0.000399
CTRUE               0.0453  2.212 0.136984
l                   0.0461  0.835 0.360842
GLOBAL                  NA 14.684 0.002108

您的模型违反了 PH 假设;由于明显违反了s变量,模型作为一个整体违反了它。

然后你给我们看这个情节: 在此处输入图像描述

如果我的 cox.zph() 没问题,我很少费心去评估这些情节。但是,我猜想绘图 y 轴呈现s 的beta 系数,并且在后续过程中似乎有所不同。比例风险假设指出,任何变量的风险在整个研究期间都必须保持不变。也就是说,s 的危险性不应随时间波动(变化)。该图显示与s相关的危害在 200 到 700 天之间不太明显。对我来说,这就是 cox.zph() 中 p=0.000399 的图形证据。

为什么会这样?主题将是您决定为什么会发生这种情况的指南。我还没有见过像这次这样突然的违规行为。这些模式通常比您的图表显示的更连续。

更重要的是,您做了正确的事情,包括sstop之间的交互项。请参阅此处的John Fox 示例

有些人会争辩说您应该对此感到满意(无需重新检查 cox.zph()。但是,我建议重新检查。