R中的离散时间风险模型(cloglog)

机器算法验证 r 生存
2022-03-20 18:44:57

中的survival软件包R似乎专注于连续时间生存模型。我有兴趣估计比例风险模型的离散时间版本,即互补对数模型。我有一个相当简单的生存模型,带有简单的右审查。

我知道估计此模型的一种方法是创建一个数据集,该数据集对于每个未“死”的时期的每个观察值都有一个单独的行。然后,可以使用glm带有链接的模型。cloglog

这种方法看起来内存效率很低;实际上,它可能会产生一个对于我机器上的内存来说太大的数据集。

第二种方法是自己编写 MLE。这很简单,但我希望有一个包装可以装上这种生存模型。使用包只会更容易协作并避免编码错误。

有人知道这样的包吗?

1个回答

每个观察有几行似乎是多余的,但很可能不是。如果模型中有任何随时间变化的协变量,那么每个观察月肯定需要自己的行。时变协变量的一个特定示例是经过的时间。由于这个变量几乎肯定应该包含在模型中,因此每个观察期都有一个单独的行是有意义的。因此,建议的第一种方法可能是最好的方法。

请注意,这与具有 Weibull 分布的连续时间比例风险模型不同。在那里,如果经过的时间是唯一的时变协变量,则可以将每个观察的生存模型简化为一条线(例如,请参见此处)。Cox 比例风险模型也有类似的结果。