Cox PH 线性假设:读取鞅残差图

机器算法验证 cox模型 线性度
2022-04-10 01:21:44

根据有关 Cox PH 模型的大量资源,应通过绘制 Martingale 残差来测试连续数值变量的线性逼近。

在 R 中,您可以survminer::ggcoxfunctional()轻松地为 Null 模型绘制这些残差: 马丁格尔图残差 这些是放大的图像,因此用户可以看到曲线的缩放函数形式,低平滑曲线说明您可以在未缩放的图像上看到的其他点这里

问题是,根据您正在查看的资源,违反线性假设的规则是:

  • 黄土曲线应该是某种线性的:

http://www.sthda.com

具有 lowess 函数的拟合线应该是线性的,以满足 Cox 比例风险模型假设。

  • 黄土曲线应该是线性和水平的:

https://www.stat.ubc.ca

在这两种情况下,平滑器大致是平的和水平的,没有表明需要进行转换。

https://www.researchgate.net

局部线性回归(LOESS)曲线通常平行于零 线

关于如何解释 Cox PH 模型中的 Martingale 残差图是否有任何真正的共识?
我的示例图是否适合线性假设?(请看放大的图片

此外,在某些资源中,马丁格尔残差图给出了变量的“函数形式”,就像这将代表每个值的 HR,这是正确的吗?

1个回答

引用 Harrell 的回归建模策略,第二版,第 494 页:

当预测变量之间的相关性较弱时,估计的预测变量变换图而不调整其他预测变量(即边际变换)可能是有用的。通过固定可以快速获得鞅残差β^= 0 对于所有预测变量。然后可以为所有预测变量制作预测变量对残差的平滑图。

因此,只要“预测变量之间的相关性是温和的”,从零模型中检查鞅残差的线性并没有必然的错误。如第 494 页的表 20.3 中所述,在这种情况下,有几种可接受的使用鞅残差的方法,具体取决于您是要估计变换还是检查非线性,以及您是否希望调整过程中的其他预测变量。

引用的参考文献之间的明显差异代表了鞅残差的计算和使用方式不同。

如果您在感兴趣的连续预测变量中显示模型 null 的残差,那么您将显示预测变量与结果的关系的形状因此,如果这是一条合理的直线,则您接近线性关系,如您引用的第一个示例(以及数据的缩小图片中)。如果你没有得到一条直线,曲线的形状可能会建议一个有用的函数形式来尝试该预测器。由于鞅残差不能超过 1,因此曲线上每个点的实际值不是风险比,但曲线的形状表明了风险与预测变量关系的一般形状。这就是您尝试估计关系的函数形式时所做的事情。

相反,如果您从包含该预测变量的估计系数的模型中检查鞅残差与预测变量的关系,那么您希望得到一条平坦的水平平滑线,表明预测变量的单个线性系数充分代表了预测变量的贡献到结果。这就是您在预测器中测试线性时所做的事情,如在第二和第三个参考文献中。

然而,特别是对于这么多数据点,从连续预测变量的受限样条拟合开始可能会提供一种更简单、更通用的方法来测试和调整非线性。如果预测变量与结果的关系是线性的,则高阶样条项将具有不显着的系数。如果关系是非线性的,您可以通过添加更多节点来调整任何合理程度的非线性。您最终应该校准整个模型(检查相对于整体线性预测器的线性度,并校正乐观度),就像Rcalibrate()中 Harrellrms包中的函数一样。