Kaplan-Meier 曲线似乎与 Cox 回归不同

机器算法验证 r 生存 cox模型 卡普兰迈尔
2022-02-28 18:29:09

在 R 中,我正在对癌症患者进行生存数据分析。

我一直在 CrossValidated 和其他地方阅读有关生存分析的非常有用的内容,并认为我了解如何解释 Cox 回归结果。但是,一个结果仍然困扰着我......

我正在比较生存与性别。Kaplan-Meier 曲线明显有利于女性患者(我多次检查我添加的图例是正确的,存活时间最长的患者,4856 天,确实是女性): 在此处输入图像描述

Cox 回归正在回归:

Call:
coxph(formula = survival ~ gender, data = Clinical)

  n= 348, number of events= 154 

              coef exp(coef) se(coef)      z Pr(>|z|)  
gendermale -0.3707    0.6903   0.1758 -2.109    0.035 *
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

           exp(coef) exp(-coef) lower .95 upper .95
gendermale    0.6903      1.449    0.4891    0.9742

Concordance= 0.555  (se = 0.019 )
Rsquare= 0.012   (max possible= 0.989 )
Likelihood ratio test= 4.23  on 1 df,   p=0.03982
Wald test            = 4.45  on 1 df,   p=0.03499
Score (logrank) test = 4.5  on 1 df,   p=0.03396

因此,男性患者 ( ) 的危险比 (HR) 为gendermale0.6903。我的解释方式(不看 Kaplan-Meier 曲线)是:由于 HR <1,作为男性患者具有保护性。或者更准确地说,女性患者在任何特定时间死亡的可能性比男性高 1/0.6903 = exp(-coef) = 1.449。

但这似乎不像 Kaplan-Meier 曲线所说的那样!我的解释有什么问题?

2个回答

这是非比例风险或生存分析中“耗尽”影响的一个很好的例子。我会尽力解释。

首先仔细看看你的 Kaplan-Meier (KM) 曲线:你可以看到在第一部分(直到大约 3000 天),在时间 t 处于危险中的人口中仍然活着的男性比例大于女性的比例(即蓝线比红线“高”)。这意味着男性确实对所研究的事件(死亡)具有“保护性”。因此,风险比应在 0 和 1 之间(并且系数应为负)。

然而,在 3000 天之后,红线更高!这确实表明了相反的情况。仅基于此 KM 图,这将进一步表明非比例风险。在这种情况下,“非比例”意味着您的自变量(性别)的影响随着时间的推移不是恒定的。换句话说,风险随着时间的推移而变化是可行的。如上所述,情况似乎如此。常规比例风险 Cox 模型不适应这种影响。实际上,主要假设之一是风险是成比例的!现在您实际上也可以对非比例风险进行建模,但这超出了此答案的范围。

还有一个额外的评论:这种差异可能是由于真正的危险是不成比例的事实上,KM 曲线的尾部估计存在很大差异。请注意,此时,总共 348 名患者将下降到仍然处于危险之中的极少数人群。如您所见,两个性别组都有经历事件的患者和被审查的患者(垂直线)。随着处于危险中的人口减少,生存估计将变得不太确定。如果您在 KM 线周围绘制了 95% 的置信区间,您会看到置信区间的宽度在增加。这对于评估危险也很重要。简而言之,由于您研究的最后阶段处于风险中的人群和事件数量较低,因此该阶段对您初始 cox 模型中的估计值的贡献较小。

最后,这将解释为什么危险(假设随着时间的推移保持不变)更符合 KM 的第一部分,而不是最终端点。

编辑:请参阅@Scrotchi 对原始问题的即时评论:如前所述,研究最后阶段数字低的影响是这些时间点的危害估计是不确定的。因此,您也不太确定明显违反比例风险假设是否不是偶然的。正如@ scrotchi 所说,PH 假设可能没有那么糟糕。

您对输出的性质感到困惑。这些数据表明:如果你是男性,你比女性更可能活得更长;女性的生存率比男性差。这反映在回归输出中,因为男性的影响是具有负对数风险比,例如男性的风险低于女性。在大多数事件时间(当曲线“步进”时),男性生存曲线大于女性,Cox 模型结果和图表非常吻合。KM 曲线证实了这一点,回归模型输出也证实了这一点。“十字架”是一个无关紧要的。

KM 曲线在尾部表现不佳,尤其是当它们接近 0% 和/或逐渐变细时。Y 轴是存活的比例。由于在研究中存活很长时间的人相对较少,而且当时死亡的人也很少,因此估计的可靠性在直观和图形上都很糟糕。我注意到,例如,您的队列中的女性明显少于男性,并且在 2,800 天后,队列中剩余的女性不到 10 人,这可以从生存曲线的步骤和缺乏审查事件中得到证明。

有趣的是,由于使用 KM 曲线、对数秩检验和 Cox 模型的生存分析使用排名生存时间,因此实际的生存持续时间有些无关紧要。事实上,您存活时间最长的女性可以再存活 100 年,并且不会对分析产生影响。这是因为基线风险函数(过去 13 年没有观察到任何事件)会假设接下来的 87 年没有死亡风险,因为那时没有人死亡。

如果您想要一个稳健的 HR 来获得正确的 95% CI 和 p 值,robust=TRUE请在 Cox-PH 中指定以获得三明治标准误差。在这种情况下,HR 是在所有失败时间比较男性和女性的时间平均 HR。