具有时间相关协变量的区间截尾生存分析

机器算法验证 生存 cox模型 审查 时变协变量
2022-03-21 05:44:09

我正在研究来自非洲的长期大型树木数据集。我有 2006 年、2008 年、2011 年和 2015 年的同一组个体的数据。数据包括每个时间段的树木状态(活/死)和协变量,例如大象损坏(类型和比例)和火灾损坏(类型和比例)、降雨量、物种、树冠高度等。我想根据 2011-2015 年的协变量值,使用 2006-2011 年的数据来预测 2015 年的死亡率。

由于数据包括经过审查的个人,我觉得我应该应用生存分析技术,例如 Cox PH 回归。然而,数据似乎是区间删失的,因为没有观察到确切的死亡时间。我只知道死亡发生在 2006 年之前,2006 年至 2008 年或 2008 年至 2011 年之间。我还有时间相关的协变量,例如每个人口普查间隔的大象损伤比例。

是否有一个 R 包用于执行基于区间的 CoxPH 与时间相关的协变量?是否有其他一些分析框架更适合这个数据集和我的问题,例如具有时间相关协变量的混合效应逻辑回归?

我是生存分析的新手。任何指导将不胜感激!

1个回答

在存在区间删失的情况下,不容易应用 Cox 回归等半参数模型。在这种情况下,默认选择是使用参数模型。

另一方面,时间相关的协变量很容易包含在右删失设置中,而不是区间删失。为了在区间删失方案中包含时间相关的协变量,已经提出了很少的方法,可能是最好的可用方法。但是,这种方法(据我所知)仅在 SAS 中实现。Weibull 模型是他们讨论的可能方法之一,因此如果您对比例风险模型感兴趣,您会很好。

对于您的分析,我看到三个选项:

  1. 根据参数生存选择后一种方法,这将是您的数据的理想选择,并使用 SAS 来拟合您的模型。
  2. 如果您更喜欢使用 R,请假设事件何时在区间内发生(例如,正态分布),并使​​用 Cox 回归进行经典的右删失分析(在这种情况下,您可以参考R 教程)
  3. 寻求替代方法,例如您提到的基于逻辑回归的方法。