xgboost 中 Cox 回归的结果是什么?

数据挖掘 xgboost 生存分析
2021-10-08 23:10:24

我正在使用xgboost. 关于它的参数,它的objectiveissurvival:cox和 its eval_metricis cox-nloglik输出Y范围从 -800 到 800。但是,预测值很大(范围从 10^3 到 10^13)。为什么是这样?Cox 回归的结果是什么xgboost

1个回答

在文档中,您可以发现预测是按风险比量表返回的:

生存:cox右删失生存时间数据的 Cox 回归(负值被认为是右删失)。请注意,预测是按风险比尺度返回的(即,在比例风险函数 h(t) = h0(t) * HR 中,HR = exp(marginal_prediction))。

换句话说,在 Cox 比例风险率模型中,我们有:

h(t)=h0(t)×X

在哪里X在传统的线性模型中是形式exp(b1x1+b2x2+...+bpxp), 和H0()=基线危险率函数。在具有树基学习器的 xgboost 案例中,X是根据特别为生存数据设计的损失函数的负梯度训练的单个树的加权和生成的指数预测。

换句话说,预测值不是失败次数。

我发现关于survival:cox 设置的xgboost 文档非常稀少并且没有很好地描述。据我所知,我不相信存在一种内部方法来推导H0() 例如。