生存分析和生命数据分析大图

机器算法验证 生存 数理统计
2022-03-13 23:35:42

我听说过生存分析和生命数据分析,但不太了解全局。

我想知道他们涵盖了哪些主题?

是纯粹的统计,还是只是在某个特定领域应用统计?

生命日期分析是生存分析的一部分吗?

谢谢并恭祝安康!

4个回答

审查的概念是生存分析和生命数据分析的关键。这个问题也可以通过工业统计进入。在监控单元样本失效所需的时间长度时,您可以

  • 完整的数据:一个单元发生故障的确切时间是已知的
  • 向右删失:一个单元的失败时间超出了当前运行时间
  • 向左删失:已知时间是在某个单元发生故障的时间之后

进入数据组合的其他问题是

  • 单独审查:所有未失败的单元都有一个共同的运行时间
  • 多重删失:未失败的单元具有不同的运行时间
  • 间隔删失:已知失败的时间在一组特定的时间之间。
  • 审查时间:审查时间是固定的
  • 审查失败:当固定数量的单元失败时停止测试
  • 竞争性失效模式:样本单元因不同原因失效

能够处理这些情况的常见分布是:对数正态分布、威布尔分布和极值分布。这些问题变得有趣,因为有处理分析的图形程序以及 MLE 和矩量法方法。

系统可靠性是该主题的一个分支,涉及贝叶斯方法、更新理论和加速寿命测试。Wayne Nelson 和 Bill Meeker 有几本关于这些主题的好书。

关于生存分析

在生存分析或事件发生时间分析中,变量或兴趣测量从起点到兴趣点的时间,例如因某种疾病而死亡。所以响应变量是一个正变量,在大多数情况下是倾斜的。因此,通常的正态假设失败,例如,经典回归技术不适用。(但请注意,有时变量的转换可以使情况变得更好)。但主要区别在于审查:处理时间到事件数据时的一个非常常见的特征。在最常见的形式(右删失)中,您不知道给定个人的确切时间,但您知道它大于某个值例如,假设您跟踪一位患者直至死亡。当时tt=10天,他还活着。在时间天,他仍然活着,但随后他失去了随访。那么你不知道确切的死亡时间,但你知道忽略审查显然不是最好的办法。相反,您可以将记录为删失观察。生存分析技术(例如,Kaplan-Meier 估计、Cox 回归等)是专门为处理审查而设计的。t=30t>30t=30

在我看来,《医学研究中的生存数据建模》作为生存分析的第一本书是一个很好的选择……但还有很多其他的。

5, 10, 12+, 14, 17, 18+, 20+

生存分析的第一个近似描述:分析因变量具有(1)精确值(完整观察值)和(2)已知值高于给定阈值(删失观察值)的数据。以上可能是生存数据样本,没有的值+是精确已知的;的值+已知更多,但不知道更多。(并且有很多扩展。)

正如斯克内克塔迪所指出的,审查是生存分析中的关键问题。如果您的数据集中没有经过审查的观察,您的任务与简单的回归任务没有区别。这也表明兴趣变量不受时间限制,可以是工资、价格等。T

因此,我认为将其称为审查回归或审查分析而不是生存分析可能更合适。