如何评估生存函数的拟合优度

机器算法验证 回归 生存 拟合优度 大车 rpart
2022-03-02 11:15:21

我是生存分析的新手,虽然我对分类和回归有一些了解。

对于回归,我们有 MSE 和 R 平方统计量。但是,除了某种图形(KM 曲线)之外,我们怎么能说生存模型 A 优于生存模型 B?

如果可能,请举例说明区别(例如,R 中的 rpart 包)。您如何证明一棵 CART 生存树优于另一棵 CART 生存树?可以使用哪些指标?

2个回答

像 Cox 模型这样的统计数据的主要问题R2(在另一个答案中描述)是它非常依赖于数据的审查分布。您可能会看到的其他自然事物,例如与空模型的似然比,也存在此问题。(这基本上是因为删失数据点对可能性的贡献与观察事件的数据点的贡献非常不同,因为其中一个来自 PDF,另一个来自 CDF。)各种研究人员已经提出了解决这个问题的方法,但我看到的那些通常要求你有一个审查分布的模型或同样不切实际的东西。我还没有研究过这种依赖性在实践中有多严重,所以如果你的审查相当温和,你仍然可以研究基于似然比的统计数据。对于生存 CART 模型,

对于通用生存模型,一个常用的统计数据是 Harrell 的c指数,类似于 Kendall 的τ或生存模型的 ROC AUC。从本质上讲,c是在您知道一个实例比另一个实例更晚经历事件的所有实例中,模型正确排名的比例。(也就是说,这里的分母中要包含一对实例,最多可以删减一个,并且必须在另一个经历事件进行删失。) c指数也取决于审查分布,但根据 Harrell 的说法,这种依赖性比我上面提到的其他统计数据要温和。不幸的是,哈雷尔的c也没有上述统计数据那么敏感,因此如果它们之间的差异很小,您可能不想在基于它的模型之间进行选择;它作为一般性能的可解释指标比比较不同模型的方法更有用。

(最后,当然,如果您对模型有特定的目的——也就是说,如果你知道你的预测损失函数是什么——你总是可以根据损失函数来评估它们!但我猜你没那么幸运……)

要更深入地讨论似然比统计和 Harrell's c,您应该查看 Harrell 的优秀教科书Regression Modeling Strategies关于评估生存模型的部分是 §19.10,第 492-493 页。对不起,我不能给你一个明确的答案,但我不认为这是一个已解决的问题!

生存数据的 Cox 比例风险回归可以被认为在许多方面对应于标准回归。例如,Cox 回归还提供残差标准误差和 R 平方统计量。请参阅coxphRsurvival包中的函数。(您可以将 KM 曲线视为对应于标准统计中的非参数分析。您如何将非参数检验纳入 CART?)在临床数据的实践中,残差标准误差往往较高,而 R 平方值较低在 Cox 回归中。

因此,标准回归和 Cox 回归具有相似的要求和限制。您必须验证数据是否符合基本假设,在 Cox 分析中,该假设进一步包括所比较的危害随时间成比例的假设。您仍然必须避免过度拟合,并且必须验证您的模型。而且据我了解CART,虽然我自己不使用,但你还是会面临比较非嵌套模型带来的困难。