具有时变协变量和效果的集成学习

机器算法验证 r 机器学习 生存 随机森林 时变协变量
2022-03-23 08:18:20

我们有兴趣使用集成学习方法复制文献中的几个持续时间研究。经过一些实验,我们选择了随机生存森林(Ishwaran et al. 2008),因为它们的简单性和性能。然而,randomForestSRCR 中的包只允许时不变协变量。正如人们可能猜到的那样,许多有趣的理论问题通常涉及随着时间的推移呈现不同值的参数。有谁知道如何使用机器学习在 R 中实现 TVC?我们更喜欢坚持随机森林,但如果有更好的选择,自然会切换。

1个回答

时变协变量 (TVC) 生存分析最广泛使用的方法是 Cox 模型。在那里,您需要使用此小插图中描述的 TVC 创建一个数据集

fit.cox <- coxph(Surv(time1, time2, event) ~ x), data = data)

然而,也有可能将 TVC 包括在随机生存森林中。Wongvibulsin、Wu 和 Zeger (2019) 的这篇论文扩展了 randomForestSRC 包以处理 TVC,但您可能需要联系作者以获取任何相关代码。