在实施鲁宾的因果模型时,我们需要的(不可测试的)假设之一是不混淆,这意味着
LHS 是反事实,T 是处理,X 是我们控制的协变量。
我想知道如何向一个不太了解鲁宾因果模型的人描述这一点。我理解为什么理论上我们需要这个假设,但我不确定从概念上为什么这很重要。具体来说,如果 T 是治疗,潜在的结果不应该非常依赖它吗?同样,如果我们有一个随机对照试验,那么自动地,. 为什么这是真的?
您如何向没有研究过 RCM 的人描述不可理解性/可忽略性假设?
在实施鲁宾的因果模型时,我们需要的(不可测试的)假设之一是不混淆,这意味着
LHS 是反事实,T 是处理,X 是我们控制的协变量。
我想知道如何向一个不太了解鲁宾因果模型的人描述这一点。我理解为什么理论上我们需要这个假设,但我不确定从概念上为什么这很重要。具体来说,如果 T 是治疗,潜在的结果不应该非常依赖它吗?同样,如果我们有一个随机对照试验,那么自动地,. 为什么这是真的?
您如何向没有研究过 RCM 的人描述不可理解性/可忽略性假设?
我认为您对潜在结果之间的差异感到困惑和观察到的结果. 后者受治疗的影响很大,但我们希望前一对不会。
这是直觉(抛开条件为简单起见)关于观察到的结果。对于每个观察,实现的结果可以表示为
这意味着和是依赖的,因为平均值不等于平均值(只要治疗效果不为零并且治疗是随机的/可忽略的)。
这是第二部分的直觉。如果我们要了解因果关系,我们将比较处理和未处理的观察结果,同时在考虑到。我们假设对照组是治疗组的反事实,如果他们没有接受治疗。但是,如果人们根据他们的潜在结果(或对潜在结果的期望)选择自己的治疗方法,那么这种比较就是对猩猩的苹果。这就像一项医学试验,只有更健康的患者才会选择痛苦的手术,因为这对他们来说是值得的。如果在调整后选择治疗的选择不是随机的,我们的比较就会被污染(测量当前健康状况的变量,医生和患者应该可以观察到)。不可观察变量的一个例子可能是有一个非常爱你的配偶,所以她敦促你接受手术,但也确保你在术后遵守医生的指示,从而改善结果。现在测量的效果是手术和爱心帮助的某种结合,这不是我们想要测量的。一个更好的例子是受到治疗的影响,无论是事后还是事前治疗。
您如何向没有研究过 RCM 的人描述不可理解性/可忽略性假设?
关于对不精通因果推理的人的直觉,我认为这是您可以使用图表的地方。从视觉上显示“流动”的意义上说,它们是直观的,它们还将明确在现实世界中可忽略性的实质含义。
有条件的可忽略性等同于声明满足后门标准。因此,直观地说,您可以对人说您选择的协变量“块”的常见原因的影响和 (并且不要打开任何其他虚假关联)。
如果您的问题中唯一可以想象的混杂变量是本身,那么这是微不足道的解释。你只是说因为包含两者的所有共同原因和,这就是你需要控制的全部。所以你可以对她说,这就是你看待世界的方式:
更有趣的情况是可能存在其他可能的混杂因素。更具体地说,你甚至可以让对方说出你的问题的潜在混杂因素——也就是说,让她说出导致这两个问题的原因。和,但它不在.
说这个人命名一个变量. 然后你可以对那个人说,你的条件可忽略性假设实际上意味着你认为会“阻挡”的效果在和/或.
你应该给她一个你认为这是真的的实质性理由。有很多图表可以代表这一点,但假设你想出了这个解释:“不会对结果产生偏见,因为即使原因和, 其对只经过,我们正在控制”。然后显示此图:
你可以想到其他的联合创始人并向她展示如何在图表上以视觉方式阻止它们。
现在回答概念性问题:
具体来说,如果 T 是治疗,潜在的结果不应该非常依赖它吗?同样,如果我们有一个随机对照试验,那么自动,. 为什么这是真的?
不,想想作为治疗任务。它说的是,您将治疗分配给“忽略”他们对治疗的反应(反事实的潜在结果)的人。一个简单的违反就是你倾向于将治疗提供给那些可能从中受益最多的人。
这也是为什么当你随机化时它会自动成立的原因。如果您随机选择治疗对象,这意味着您没有检查他们对治疗的潜在反应来选择他们。
为了补充答案,值得注意的是,在不讨论因果过程的情况下理解可忽略性,即不调用结构方程/图形模型真的很难。大多数时候,您会看到研究人员呼吁“治疗似乎是随机的”的想法,但没有证明为什么会这样,或者为什么使用现实世界的机制和过程是合理的。
事实上,许多研究人员只是为了方便而假设可忽略性,以证明使用统计方法的合理性。Joffe、Yang 和 Feldman 论文中的这段话说出了一个大多数人都知道但在会议演讲中不会说的不便的事实:“可忽略性假设通常是因为它们证明使用可用的统计方法是合理的,而不是因为它们被真正相信。”
但是,正如我在答案开头所说的那样,您可以使用图表来争论治疗分配是否可以忽略。虽然可忽略性的概念本身很难理解,因为它陈述了对反事实数量的判断,但在图中,您基本上是在对因果过程(这个变量导致那个变量等)做出定性陈述,这些陈述很容易解释并且在视觉上很有吸引力。
如前一个答案所述,图表和潜在结果之间存在形式上的等效性。因此,您也可以从图表中读取潜在结果。使这种联系更正式(更多信息请参见 Pearl 的因果关系,第 343 页),您可以采用以下定义:潜在结果将代表当 T 保持不变时影响 Y 的所有变量(观察项和误差项)的总和.
然后很容易看出为什么 RCT 中存在可忽略性,但更重要的是,它还可以让您轻松发现可忽略性不成立的情况。例如,在图中, T 是可忽略的,但在给定 X 的情况下,T 不是条件可忽略的,因为一旦以 X 为条件,就会打开从 X 的错误项到 T 的碰撞路径。
综上所述,为了方便,许多研究人员默认做出了可忽略性假设。这是一种方便的方式来假设一组控制的充分性,而无需正式证明为什么会这样,但是要解释它在外行人的真实环境中意味着什么,您需要调用一个因果故事,即因果假设,你可以借助因果图正式讲述这个故事。