生存分析中 Kaplan-Meier 曲线的置信区间仅存在于第一个(非删失)事件之后的时间。示例 R 代码:
set.seed(1)
library(survival)
n = 30
x = 10 + sort(10*rexp(n))
u = rep(0, n)
u[15] = 1
l = survfit(Surv(x,u)~1)
plot(l)

虽然所有时间点的实际 Kaplan-Meier 曲线都得到了很好的定义,但(逐点)置信区间似乎对于早于 ~18 的所有时间点都没有定义。
但是,即使对于这些早期时间点,至少尝试计算置信区间似乎也是合理的。例如,如果我们对时间点 10 感兴趣,我们观察到在 30 个可能的事件中,没有发生在时间 10 之前,因此使用三规则,一个简单的近似置信区间(至少)生存到时间 10是 [1−3/30, 1] = [0.9, 1]。当然,这总比没有置信区间要好。
然而,对于 10 到 18 之间的时间点,有几个删失的观察结果。是否仍然可以计算合理的置信区间?或者这些删失的观察结果是软件包在第一个非删失事件之前的时间点没有显示任何置信区间的原因。