我有乳腺癌试验数据,其中,对于亚组 1 和 2,正在比较两个治疗组。结果是:
- 对于亚组 1,
N=33
中位生存期trt1=10mo
,中位生存期trt2=5.7mo
,差异 p 值=0.18
。 - 对于亚组 2,
N=16
中位生存期trt1=10mo
,中位生存期trt2=5.5mo
,差异 p 值=0.003
。
对于具有较小 N 和中位 OS 在两个子组中相似的子组 2,p 值如何显着?
我有乳腺癌试验数据,其中,对于亚组 1 和 2,正在比较两个治疗组。结果是:
N=33
中位生存期trt1=10mo
,中位生存期trt2=5.7mo
,差异 p 值=0.18
。 N=16
中位生存期trt1=10mo
,中位生存期trt2=5.5mo
,差异 p 值=0.003
。对于具有较小 N 和中位 OS 在两个子组中相似的子组 2,p 值如何显着?
您所指的 p 值是对数秩检验或可能是 Wilcoxon 的结果。该测试比较了治疗组和对照组在每个故障时间的预期故障和观察到的故障。它是对整个故障时间分布的测试,而不仅仅是中位数。被拒绝生存数据的对数秩检验的原假设是,比较治疗组和对照组失败的时间平均风险比为 1。
值得一提的是,这项测试的力量不是由各种治疗组或层级中处于危险中的个体数量驱动的,而是观察到的失败次数。因此,即使您在一个层中有两倍的样本量,如果在观察到失败之前对许多样本进行了审查,那么在另一层中看到更大的权力并不奇怪——即使 KM 曲线看起来相同——因为更大的失败次数。
如果我们拒绝零假设并发现亚组 2 与对照组相比在生存率方面存在显着差异,但亚组 1 没有这种差异,则有证据表明亚组对治疗进行了效果修正。这表明亚组 2 中的生存率存在差异,但亚组 1 没有。作为敏感性分析,显示 Kaplan Meier 曲线和可能作为时间函数的风险比的平滑估计是有用的。我的猜测是,虽然中位数的存活率可能相当,但正是失败时间的前四分位数中的事件序列驱动了大部分推断,你会看到其中一个治疗组的存活率迅速下降对于子组 2。
这是两个生存曲线的虚构示例,它们具有几乎相同的中位生存期(和相同的五年生存期)但非常不同。对数秩检验发现两条曲线之间的差异具有统计学意义,P=0.04。这简单地指出了一个明显的事实:两条生存曲线可以具有相同的中位生存期,但在其他方面存在差异。
改编自Intuitive Biostatistics的图 29.4 。