协变量不可用于删失数据的生存分析

机器算法验证 生存
2022-03-12 06:42:20

我正在查看法官做出决定所需的时间。每位法官都会评估一些申请人,并且可以批准或不批准申请。当法官提交报告时,案件就完成了,这可能是在听证会之后的一段时间。在研究期结束时,仍有许多案件未结案。

我想估计案件通过系统所需的平均时间。另外,我想看看被拒绝的案件是否比批准的案件需要更长的时间。(法官似乎花费更长的时间来撰写他们最终未能批准的报告,或寻求额外的文件)。

显然,我不知道研究结束时仍然开放的案例是否会被批准,因此协变量(批准/不批准)与数据一起被审查。

对此我能做些什么吗?

2个回答

@jsk 在他们对@Alexis 答案的评论中有关键。在这种情况下使用的适当类型的生存分析是竞争风险。您有三种可能的结果:a) 接受、b) 拒绝和 c) 右删失。

关键是接受/拒绝不是一个单一的协变量,而是两个相互竞争的风险。在大多数统计软件中,这很容易。例如,在 R 的survival包中,您只需将事件编码为具有级别censoredaccepted和的因子rejectedcensored必须是第一级,其他级别假定为竞争风险。)

如果我理解你的话,这是相当标准的生存分析/事件历史分析右审查的东西;Kaplan-Meyer、离散时间风险模型等都估计事件“是否以及何时发生”,同时通过合并有事件风险的样本随时间的收缩来考虑事件发生的右删失(即您的案例案例批准)由于事件的发生和审查。

维基百科的文章给出了不错的介绍。您可以查看 Singer, JD 和 Willett, JB (2003)。应用纵向数据分析:建模变化和事件发生牛津大学出版社,纽约,纽约,详细介绍了离散时间事件历史模型,并且在 Cox 比例风险模型方面有相当不错的部分。