这是生存分析的问题吗?

机器算法验证 生存
2022-03-30 11:42:05

我有一个个人数据集。每个人都有相同的开始时间,我们开始观察他们。所有个人也有一个结束时间。有些人在到达结束时间之前就失败了,有些人从不失败并到达结束时间(即他们成功)。这是一个生存分析问题,因为我正在尝试对事件时间(失败)进行建模。我的困惑来自于那些成功的人。我显然不能将这些人视为观察到的失败,但我也不能将它们视为审查过的。这是因为审查意味着他们没有被观察到失败,但他们会在未来的某个时候失败(我们只是不知道什么时候)。在我的情况下这不是真的,因为如果一个人直到最后都没有失败,它就永远不会失败。那么我该如何对付这些从不失败的人呢?这仍然是一个生存分析问题吗?

这是一个例子。

假设一组运动员都开始为下届奥运会进行训练。他们中的一些人最终会因训练受伤而无法参加比赛。但是,如果运动员在奥运会日期之前没有受伤,那么他/她将能够参加比赛(即成功)。所以这些没有受伤并且能够比赛的运动员不会被审查,因为他们在奥运会之后是否受伤是无关紧要的。我们只关心他们是否受伤直到奥运会举行

1个回答

一些想法:

  • 正如@PeterFlom 提到的,如果您只是想知道他们是否“成功”,这是一个适合逻辑回归或二项式回归的 0/1 结果,如果您不这样做,则可以在生存分析的范围之外解决不太关心他们失败的时间。

但是……你说你很在乎,所以转向生存分析:

  • 是的,“事件发生时间”问题是生存分析问题,这看起来很清楚。
  • “奥运审查”是否是一个问题,实际上取决于你想问的问题。只是在谈论一群为奥运会训练的运动员受伤之前的时间吗?如果是这样的话,我可以看到有人提出这样的论点,即那些确实参加奥运会的人受到了审查 - 给定无限的时间并且没有其他结果他们会伤害自己,我们只是停止关注他们。
  • 另一方面,如果您在为奥运会训练时真的对受伤感兴趣,那么是的,将它们视为审查是一个问题。你现在真正拥有的是一个时间,直到两个相互排斥的结果:1)在奥运会前受伤和 2)参加奥运会。您现在处于竞争风险生存分析领域,评论中建议的治愈模型是其中的一个子集。一组相关的模型是“混合模型”,顾名思义,该模型是两种结果的混合。

这篇论文:http : //aje.oxfordjournals.org/content/170/2/244.short 由 AJE 中的 Lau、Cole 和 Gange 撰写,是对生存分析混合模型的出色回顾。但是请注意,来自一个为传统生存分析提供良好记录和实施的软件包的地方,混合模型宇宙……从软件方面发展得稍差。