生存分析的功效分析

机器算法验证 生存 统计能力 遗传学
2022-03-07 04:48:07

如果我假设基因特征将识别出复发风险较低的受试者,即 20% 人群的事件发生率降低 0.5(风险比为 0.5),并且我打算使用来自回顾性队列研究的样本进行是否需要针对两个假设组中的不相等数量调整样本量?

例如使用 Collett, D: Modeling Survival Data in Medical Research, Second Edition - 2nd Edition 2003。所需的事件总数 d 可以通过以下方式找到:

d=(Zα/2+Zβ/2)2p1p2(θR)2

其中分别是标准正态分布的上和上Zα/2Zβ/2α/2β/2

对于特定值,

  • p1=0.20
  • p2=1p1
  • θR=0.693
  • α=0.05所以Z0.025=1.96
  • β=0.10所以Z0.05=1.28

并取,需要(四舍五入)有 90% 的机会检测到 0.50 的风险比在两侧 5 显着的事件数% 水平然后由下式给出θR=logψR=log0.50=0.693

d=(1.96+1.28)20.20×0.80×(log0.5)2=137

1个回答

是的,你的力量会根据曝光与未曝光的比率而变化。例如,在最近的一项研究中,我进行了功效计算,在相同的样本量下,1:2 的曝光:未曝光比率在 HR 约为 1.3 时实现了功效 = 0.80。直到 HR ~1.6 左右,比例为 1:10。

在您的情况下,由于样本量会有所不同,但您的 HR 不会,因此比率越小,您的样本量就需要越大。