我知道预测变量的相对重要性是一个棘手的问题。建议的方法范围从非常复杂的模型到非常简单的变量转换。我已经明白,最聪明的人仍在争论在这件事上走哪条路。我正在寻找一种简单但仍然有吸引力的方法来解决生存分析(Cox 回归)中的问题。
我的目标是回答这个问题:哪个预测器是最重要的(就预测结果而言)。原因很简单:临床医生想知道首先要解决哪个风险因素。我知道临床环境中的“重要”不等于回归世界中的“重要”,但有一个链接。
我是否应该使用以下方法计算每个变量解释的可解释对数似然的比例(参见 Frank Harrell的帖子):
library(survival); library(rms)
data(lung)
S <- Surv(lung$time, lung$status)
f <- cph(S ~ rcs(age,4) + sex, x=TRUE, y=TRUE, data=lung)
plot(anova(f), what='proportion chisq')
据我了解,只有可能对 Cox 模型使用“比例 chisq”,这足以传达每个变量相对重要性的某种意义。或者我应该使用默认图(anova()),它显示 Wald χ2 统计量减去其评估每个变量的部分影响的自由度?
如果有人对此事有任何经验,我将不胜感激。