我对生存分析相当陌生。我被建议查找并学习 Schoenfeld 残差作为模型诊断的一部分,以查看是否满足比例风险假设。在查找此内容时,我看到了对许多不同类型残差的引用,包括:
- 考克斯内尔
- 偏差
- 鞅
- 分数
- 勋费尔德
这些残差之间有什么区别,何时建议使用一个而不是另一个?(我很高兴答案只是指向要阅读的论文的链接。)
我对生存分析相当陌生。我被建议查找并学习 Schoenfeld 残差作为模型诊断的一部分,以查看是否满足比例风险假设。在查找此内容时,我看到了对许多不同类型残差的引用,包括:
这些残差之间有什么区别,何时建议使用一个而不是另一个?(我很高兴答案只是指向要阅读的论文的链接。)
Cox-Snell 残差用于评估模型的拟合优度。通过绘制 Cox-Snell 残差与累积风险函数的关系,可以评估模型的拟合度。一个拟合良好的模型将呈现一条通过原点的线性线,具有单位梯度。应该注意的是,Cox-Snell 残差需要一个特别不合适的模型才能显着偏离这一点。在图表的末端看到一些轻微的跳跃也很常见。对 Cox-Snell 残差的一个批评是它们没有考虑删失的观察结果,因此调整后的 Cox-Snell 残差由 Crowley & Hu (1977) 设计,其中标准 Cox-Snell 残差可用于未经审查的观察和其中,用于调整残差。
鞅残差可以定义为其中被审查,则取值为 0,如果观察未被审查,则取值 1 。鞅残差的值介于和审查意见。鞅残差可用于评估特定协变量的真实函数形式 (Thernau et al. (1990))。在该图上覆盖 LOESS 曲线通常很有用,因为它们在具有大量观察值的图中可能会很嘈杂。鞅残差也可用于评估数据集中的异常值,幸存者函数预测事件太早或太晚,但是,为此使用偏差残差通常更好。
偏差残差其中正鞅残差取值为 1,负鞅残差取值为 -1。高绝对值的残差表示异常值。正值偏差残差表示观察到事件发生的时间比预测的要早;对于负值残差,反之亦然。与 Martingale 残差不同,偏差残差的均值以 0 为中心,在寻找异常值时,它们比 Martingale 残差更容易解释。偏差残差的一种应用是仅使用一个建模参数对数据集进行折刀,并在删除每个观察值时测试参数系数的显着差异。一个显着的变化将表明一个非常有影响力的观察。
Schoenfeld 残差略有不同,因为每个残差对应一个变量,而不是一个观察值。使用 Schoenfeld 残差是为了检验比例风险假设。Grambsch 和 Thernau (1994) 提出缩放 Schoenfeld 残差可能更有用。通过针对每个变量的 Schoenfeld 残差绘制事件时间,可以通过将 LOESS 曲线拟合到图中来评估变量是否符合 PH 假设。一条通过残差值为 0 且梯度为 0 的直线表示该变量满足 PH 假设,因此不依赖于时间。Schoenfeld 残差也可以通过假设检验来评估。