随机分配:何必呢?

机器算法验证 计量经济学 实验设计 因果关系 工具变量 随机分配
2022-03-28 22:20:05

随机分配很有价值,因为它确保了治疗与潜在结果的独立性。这就是它如何导致对平均治疗效果的无偏估计。但其他分配方案也可以系统地确保治疗与潜在结果的独立性。那么为什么我们需要随机分配呢?换句话说,随机分配与非随机分配方案相比有什么优势,非随机分配方案也会导致无偏推理?

Z是治疗分配的向量,其中每个元素为 0(未分配给治疗的单位)或 1(分配给治疗的单位)。在 JASA 的一篇文章中,Angrist、Imbens 和 Rubin (1996, 446-47)说治疗分配Zi是随机的,如果Pr(Z=c)=Pr(Z=c)对全部cc这样ιTc=ιTc, 在哪里ι是所有元素都等于 1 的列向量。

换句话说,声明是指派Zi如果任何赋值向量包含m分配给治疗的可能性与任何其他载体一样可能,包括m治疗任务。

但是,为了确保潜在结果与治疗分配的独立性,确保研究中的每个单元具有相同的治疗分配概率就足够了。即使大多数治疗分配向量被选择的概率为零,这种情况也很容易发生。也就是说,即使在非随机分配下也可能发生。

这是一个例子。我们想要运行一个包含四个单元的实验,其中恰好两个单元被处理。有六个可能的分配向量:

  1. 1100
  2. 1010
  3. 1001
  4. 0110
  5. 0101
  6. 0011

其中每个数字中的第一个数字表示是否处理了第一个单元,第二个数字表示是否处理了第二个单元,依此类推。

假设我们进行了一个实验,其中我们排除了分配向量 3 和 4 的可能性,但其中每个其他向量都有相同 (25%) 的机会被选中。该方案不是 AIR 意义上的随机分配。但在预期中,它会导致对平均治疗效果的无偏估计。这绝非偶然。任何给予受试者相同概率分配到治疗的分配方案都将允许对 ATE 进行无偏估计。

那么:为什么我们需要 AIR 意义上的随机分配?我的论点植根于随机推理;如果人们考虑的是基于模型的推理,那么 AIR 的定义是否看起来更合理?

3个回答

这是对gung的评论的跟进。总体平均治疗效果不是重点。

假设你有1000受试者年龄介于515, 和1000新的糖尿病患者超过30. 您想将一半分配给治疗。为什么不掷硬币,正面治疗所有年轻患者,反面治疗所有老年患者?每个人都会有一个50%有机会被选中进行治疗,因此这不会使治疗的平均结果产生偏差,但会丢弃大量信息。如果青少年糖尿病或年轻患者的反应比患有 II 型或妊娠糖尿病的老年患者好或差得多,这不足为奇。观察到的治疗效果可能是无偏的,但是,例如,它的标准偏差会比通过随机分配产生的要大得多,尽管样本很大,你也不能说太多。如果你使用随机分配,那么很有可能大约500每个年龄组的病例都会接受治疗,因此您可以比较每个年龄组内的治疗与不治疗。

您可能比使用随机分配做得更好。如果您注意到一个您认为可能会影响对治疗的反应的因素,您可能希望确保具有该属性的受试者比随机分配的受试者分配得更均匀。随机分配让您可以同时处理所有因素,这样您就可以分析许多可能的模式。

在您的示例中,您也可以省略 2 和 5 并且不要自相矛盾。在项目级别上,只有1:1的几率选择1或6时,仍然存在相等的机会。

这是另一个潜伏或混杂的变量:时间(或仪器漂移、样本存储的影响等)。
所以有人反对随机化(正如道格拉斯所说:你可能比随机化做得更好)。例如,您可以事先知道您希望您的案件随着时间的推移而平衡。正如您事先知道的那样,您想要平衡性别和年龄。

换句话说,如果您想手动选择 6 个方案中的一个,我会说 1100(或 0011)是一个非常糟糕的选择。请注意,您抛出的第一个可能性是那些在时间上最平衡的可能性......在约翰提议同时抛出 2 和 5(您没有反对)之后,最差的两个被留下。
换句话说,不幸的是,您的直觉哪些方案“不错”会导致不良的实验设计(恕我直言,这很常见;也许有序的东西看起来更好 - 并且肯定在实验期间更容易跟踪逻辑序列)。

您可能可以使用非随机方案做得更好,但您也可以做得更糟。恕我直言,如果您选择非随机方案,您应该能够为您使用的特定非随机方案提供物理/化学/生物/医学/...论据。