随机分配很有价值,因为它确保了治疗与潜在结果的独立性。这就是它如何导致对平均治疗效果的无偏估计。但其他分配方案也可以系统地确保治疗与潜在结果的独立性。那么为什么我们需要随机分配呢?换句话说,随机分配与非随机分配方案相比有什么优势,非随机分配方案也会导致无偏推理?
让是治疗分配的向量,其中每个元素为 0(未分配给治疗的单位)或 1(分配给治疗的单位)。在 JASA 的一篇文章中,Angrist、Imbens 和 Rubin (1996, 446-47)说治疗分配是随机的,如果对全部和这样, 在哪里是所有元素都等于 1 的列向量。
换句话说,声明是指派如果任何赋值向量包含分配给治疗的可能性与任何其他载体一样可能,包括治疗任务。
但是,为了确保潜在结果与治疗分配的独立性,确保研究中的每个单元具有相同的治疗分配概率就足够了。即使大多数治疗分配向量被选择的概率为零,这种情况也很容易发生。也就是说,即使在非随机分配下也可能发生。
这是一个例子。我们想要运行一个包含四个单元的实验,其中恰好两个单元被处理。有六个可能的分配向量:
- 1100
- 1010
- 1001
- 0110
- 0101
- 0011
其中每个数字中的第一个数字表示是否处理了第一个单元,第二个数字表示是否处理了第二个单元,依此类推。
假设我们进行了一个实验,其中我们排除了分配向量 3 和 4 的可能性,但其中每个其他向量都有相同 (25%) 的机会被选中。该方案不是 AIR 意义上的随机分配。但在预期中,它会导致对平均治疗效果的无偏估计。这绝非偶然。任何给予受试者相同概率分配到治疗的分配方案都将允许对 ATE 进行无偏估计。
那么:为什么我们需要 AIR 意义上的随机分配?我的论点植根于随机推理;如果人们考虑的是基于模型的推理,那么 AIR 的定义是否看起来更合理?