如何使用 xgboost 预测生存曲线?

数据挖掘 xgboost 生存分析
2021-10-12 23:23:15

xgboost 包使用参数参数启用生存建模:objective = "survival:cox" 和 eval_metric = "cox-nloglik"。

结果模型的预测方法仅输出风险评分(与rtype = "risk"中的survival::coxph函数相同)。

如何使用 xgboost 预测整个生存曲线?

1个回答

比例风险模型假设以下形式的风险率: H(|X)=H0()r一世sķ(X) 通常在哪里 r一世sķ(X)=eXp(Xβ). predictxgboost方法返回r一世sķ(X)只要。我们能做的就是使用survival::basehaz函数来查找H0().

问题是它没有“校准”到计算的实际基线危险率xgboost我们能做的就是找到一些常数C最小化样本观察到的死亡/审查时间和H0()r一世sķ(X)C.

我已经在我编写的一个很小的 ​​R 包中实现了这种方法。