我知道 Kaplan-Meier 估计量是有偏见的,因为我的教科书是这样说的。但是,我不明白为什么以下证明不起作用:
让是生存函数的 Kaplan-Meier 估计在哪里是 iid 失败时间。让是累积风险函数的 Nelson-Aalen 估计量.
众所周知.
现在,是鞅,因为是鞅,因为是一个可预测的过程。
所以,自从是一个非随机函数。
我知道 Kaplan-Meier 估计量是有偏见的,因为我的教科书是这样说的。但是,我不明白为什么以下证明不起作用:
让是生存函数的 Kaplan-Meier 估计在哪里是 iid 失败时间。让是累积风险函数的 Nelson-Aalen 估计量.
众所周知.
现在,是鞅,因为是鞅,因为是一个可预测的过程。
所以,自从是一个非随机函数。
你的论点的缺陷是不是永远的鞅. 它只是当时的鞅实验结束时,即最后一名幸存者死亡或被审查(即退出研究)时。在那之后,继续增加,但才不是。
现在,如果样本中的最后一个幸存者真的死了,那么此时这并不重要不再是鞅,因为因此将继续是鞅。因此,如果没有审查数据,KM 估计量实际上是无偏的(很容易直接显示这一点而无需随机过程)。
然而,如果存在审查,这就增加了最后剩下的幸存者将被审查而不是死亡的可能性。在这种情况下永远不会下降到零,所以将不再是鞅. 这种可能性——最后一个幸存者被审查——是知识管理估计器中偏差的来源。