如何在生存分析中选择最佳分类方案(SurvivalROC、R2、Concordance、AIC)?

机器算法验证 生存 aic r平方 模型比较
2022-04-02 13:14:29

我正在研究几种关于患者生存时间分类的方案。让我假设我只有两个方案来说明这个问题。

假设方案 1 将患者分为 5 组,方案 2 也将患者分为 5 组(但组的组成不同,例如方案 1 中的患者 1 可能在组 3 中,方案 2 中的组4)。

所以,这是我的问题,但有几个方案。

KM 图对分析很有用,但不实用,有些图在视觉上非常相似。我认为logrank测试不是这样,因为我认为它只是验证我是否真的在曲线之间的生存经验上有任何差异而不是更多。

实际上,我想要的是验证哪种方案在某种准确性上给了我更好的预测,这实际上是一种衡量标准。我认为的一种方法是仅使用该survivalROC软件包并将该survivalROC功能应用于例如 60、120 和 180 次,以及哪种方案可以提供最佳 AUC。

我认为的另一种方法是将这些方案与 cox 比例风险模型一起使用,它真的是另一种选择吗?使用coxph我可以拥有的功能R2及其返回的一致性,我也可以使用该extractAIC函数计算 AIC,并使用较少的 AIC 选择最佳方案。

在 AIC 案例中,我有一些疑问,因为我之前认为 AIC 很好,但是我最近什么时候读到它,我刚刚发现了 COX PH 嵌套模型的示例,它是否也适用于非嵌套模型?

所以,总而言之,我想到了 4 个选项:

  1. survivalROC并使用 AUC
  2. coxph并使用R2
  3. coxph并使用索引
  4. coxph并使用extractAIC

我想使用一种数值度量来自动选择最佳方案(记住非嵌套模型的性质)来自动化我的分析。

我在想这种方法有什么问题吗?哪个可能是最好的衡量标准?

1个回答

我认为模式的组在任何给定时期都不具有事件的绝对概率。在这种情况下,您关心的排名会导致关注 AUC 或您给出的选项的一致性。

一致性度量是 AUC 对时间结果的概括。因此,除非您真的关心特定时间点,否则我会说您使用一致性度量而不是固定时间点的 AUC。

在将模式结果更改为具有给定序数比例的数字变量并将它们设置在公式参数survival::survConcordance的右侧后,您可以获得任一模型的一致性度量。~

警告

我的假设是您没有进行建模,而是给出了模型/模式,您必须比较每个模型/模式在哪里为您提供每个人的风险顺序分组。但是,如果您进行建模,那么我同意@Frank Harrell 的评论

拒绝序数组。重来。不当。