Kaplan-Meier 多组比较

机器算法验证 r 生存 非参数 多重比较 卡普兰迈尔
2022-03-21 21:26:00

假设我有以下数据框

library(survival)
library(multcomp)
data(cml)
cml$group<-sample(1:5, 507, replace=T)
plot(survfit(Surv(time=cml$time, cml$status)~factor(cml$group)))
(survdiff(Surv(time=cml$time, cml$status)~factor(cml$group)))

我想执行多重比较测试比较(logrank),例如 group0 与所有其他组甚至每个组之间?

是否需要校正多重比较?如果是,有没有一种很好的方法来绘制这些多重比较(例如在plot.TukeyHSD()aov())?

我在https://stackoverflow.com/questions/11176762/kaplan-meier-multiple-group-comparisons中发布了相同的问题,但答案提出了具有参数生存而不是非参数的多重比较测试(如我的情况)。

2个回答

事件历史模型中出现的推理问题之一是不同组中的危险函数和生存函数可以在不同的时间点相互交叉例如,以下两个条件都可以为真:

  1. A 组中经历该事件的那些人(即“无法生存”)可能会相对较快地这样做,而 B 组中经历该事件的人需要更长的时间才能这样做。
  2. A组的总生存率可能高于B组。

因此,当您询问想要在组之间进行比较时,您具体想比较什么?中位生存时间?时间t的危险? 在时间t的生存?直到生存“变平”的时间(对于“变平”的某些含义)?还有什么?

一旦您对要比较的内容提出了明确的问题,多重比较调整就有意义了。某些情况(例如,在每个时间点t的比较)可能会使FWER多重比较调整方法中的家庭定义出现问题,这可能会使一个人倾向于FDR方法,因为它们缩放/不依赖于家庭的定义.

巧合的是,您确实可以将其视为同质性的 Pearson 卡方检验。如果您定义的组是在相似的时间尺度上测量的并且正在被测量,那么实际比较生存曲线是有意义的。

一个鲜为人知的事实是,对数秩检验实际上是对 Cox 比例风险模型产生的部分似然方程的分数检验。因此,如果您的目标是创建一个全局危害测试,您可以使用组指标拟合 Cox 模型并进行多变量偏似然比测试。

非比例生存曲线是一种敏感性,因为它们降低Cox 模型对数秩检验的功效,具有所有相同的敏感性和假设。但是,将模型结果与幸存者函数的 Kaplan Meier 估计一起呈现的明显解决方案应该快速评估这一点并解释其中的所有敏感性。