我正在尝试用 R 绘制我的数据的 Kaplan-Meier 曲线。目前,数据采用以下格式:
patient_id;number_of_days;survival
1 ;100 ;T
1 ;200 ;F
1 ;300 ;F
2 ;50 ;F
...
在我的上下文中,生存不能按字面解释:它意味着疾病的进展,仅在或多或少等间隔的时间点进行评估。
我无法确定Surv函数期望的输入是什么?我应该如何准备数据?
我尝试将我的数据直接提供给Surv:
Surv(data$number_of_days,data$survival)
然而,这似乎多次计算每个患者(每个时间点一次)。所以我的猜测是我必须首先对我的数据进行某种转换。我相当肯定这个将纵向数据转换为“事件数据”的问题一定是相当普遍的,那么这怎么称呼呢?它已经在某个地方实施了吗?
谢谢!
