独立观测值的 Kaplan-Meier 估计方差

机器算法验证 方差 生存 非独立的 卡普兰迈尔
2022-03-14 01:08:52

有人可以帮我找到一种方法来估计 Kaplan-Meier 估计与相关观察的方差吗?具体来说,我有来自患者的失败时间数据,每个患者都有几个不同的观察结果(不同的患者可能有不同数量的观察结果)。假设不同患者的观察是独立的,但来自同一患者的观察预计是依赖的。

有人向我推荐了两本出版物,“牙种植体生存的 Kaplan-Meier 分析:使用聚类观察估计生存的策略”“依赖失效时间观察的 Kaplan-Meier 估计”,其中第二个被第一个引用。

但是我无法理解这些。第一个有错误,第二个似乎更严格,但方差方程没有意义(1-form 上的双重积分)。

1个回答

在这种情况下,同一组内可能会同时发生多个相同类型的事件。对于第一个参考,分组是同一个人内的多个植入牙齿。对于第二个参考文献,由 Ying 和 Wei 提出,窝是群体,多重事件是一窝中超过 1 个成员患上肿瘤。

这种组内依赖性可以用一个无穷小的折刀方差估计器来考虑,这可以被认为与从模型中一次删除一个组有关。* 在Rsurvival中,这是为一个简单的 Kaplan-Meier 估计完成的通过id为每个组指定一个变量。

Ying 和 Wei 在示例中使用的数据原来是数据包rats中包含的数据的子集survival(未处理的女性)。折刀的标准误 (SE) 与 Ying 和 Wei 报告的非常接近。

时间 公里估计 SE,未校正 SE、Ying 和 Wei SE,折刀
70 0.9190 0.028 0.026 0.0265
80 0.8733 0.034 0.032 0.0320
90 0.8227 0.041 0.046 0.0466
100 0.8074 0.043 0.047 0.0477

在 R 中执行此操作的代码:

> library(survival)
> fitJackknife <- survfit(Surv(time,status)~1,data=rats, subset=rx==0&sex=="f",id=litter)
> summary(fitJackknife,times=c(70,80,90,100))
Call: survfit(formula = Surv(time, status) ~ 1, data = rats, subset = rx == 
    0 & sex == "f", id = litter)

 time n.risk n.event survival std.err lower 95% CI upper 95% CI
   70     88       8    0.919  0.0265        0.868        0.972
   80     71       4    0.873  0.0320        0.813        0.938
   90     63       4    0.823  0.0466        0.736        0.919
  100     50       1    0.807  0.0477        0.719        0.907

*无限小折刀是原始折刀的极限情况,其中一次删除一个观测值(权重 = 0),同时保留其他观测值(权重 = 1)。这是当权重接近 0 时的限制情况。Therneau 和 Grambsch在第 7.2 节中解释了如何实施以在生存模型中获得方差估计。