在 RCT 中使用分层随机化时,每层应准备多少个信封?

机器算法验证 正态分布 二项分布 临床试验 分层 随机分配
2022-04-04 07:35:33

如果考虑一个假设的 RCT,比如说总样本量为 300,根据外科手术(开放式手术、封闭式手术或联合手术)分为三个层次。将在每个层内以 2 人为一组进行阻止。

在生成随机化序列时,显然无法提前知道有多少患者将被随机化到每个层中。

那么,应该为每个层制作多少个随机包络?根据之前的数据,预计每组大约 33/33/33,但如果每组只制作 100 个信封,这在历史数据错误的情况下没有灵活性。

应该:

  • 安全起见,每层做 300 次(试验完成后还有很多剩余),或者
  • 根据先前的数据猜测所需的数字,并内置缓冲因子?

任何提示将不胜感激!

2个回答

阶层人口具有多项分布。300 足够大,正态近似值将是准确的,这意味着任何给定层中的总体具有正态分布。尽管所有三个计数都是相关的,但假设它们不相关并应用 Bonferroni 校正仍然是一个很好的近似值:也就是说,要确保没有耗尽任何层的包络的机会,找到上面的这个分布的分位数。(例如,对于,这个分位数等于 122.2,我们将其四舍五入为 123)为每个层创建这么多的信封。(100,1323300)1α1α/3α=.01

如果您不相信这些近似值,那么模拟许多实验很容易。在 1,000,000 项试验中,有 10,064 名患者有 123 名或更多患者,这表明 122 个信封在 98.99% 以上的情况下就足够了。

你可能甚至不想冒 1/100 的风险。如果准备128个信封,用完的风险只有1/1000;使用 133 个信封,它下降到 1/10,000。4,000,000 次实验的模拟证实了这一预期。

最后留下太多随机分配没有任何后果,而让您的随机化方案在试验分配中失败的后果相当大。考虑到一个信封和一张纸的成本,我会在安全方面投票,每人赚 300 个。

如果您想稍微削减预算,根据 whuber 的回答,我会选择 150 左右,并且属于“不太可能”的类别。