我目前正在从事一个生存分析项目,并且正在为R 中包coxph功能的内部工作而苦苦挣扎。survival
该项目调查了数字度量对员工任期长度的影响。该度量是针对每个日历周计算的。为此,我正在使用coxph. 更准确地说,时变协变量的版本:
out <- coxph(formula = Surv(tstart, tstop, turnover) ~ score, data = mydata)
本质上,生存分析应该检查最近的分数历史,而不仅仅是本周的值。但是,我不确定这是否已经是标准程序的一部分,coxph或者我是否需要自己调整分数值(例如,通过过去 X 周的滚动总数)。不幸的是,消息来源似乎不同意这一点。
在这个问题的答案中,似乎自动包含了时变协变量的过去值。
换句话说,在时间 t 的危险取决于事件在时间 t 发生的概率,假设它到目前为止还没有发生 (T≥t) 并且给定过去 (H(t_))。这个过去包括到时间 t 的信息。
相比之下,这个小插曲的作者则相反:
该模型尝试根据事件时间之前每个主题的协变量值,为每个主题分配一个风险评分,以最好地预测每个绘图的结果。
对于 R 中 Cox 比例风险模型这一方面的一些澄清,我将不胜感激,因为它决定了我需要如何准备数据和解释输出。