经常有人告诉我,因果推理的关键困难在于我们只观察到和之间的一个值,而我们想要估计。总有一个未观察到的值。
这是我的问题:为什么我们不简单地使用处理的样本来回归,并且类似地使用处理的样本来回归,并且将它们结合起来估计?
从这个角度来看,因果推理只是两个回归问题,不需要被视为一个特殊领域。我确信一定有什么问题,但它是什么?
经常有人告诉我,因果推理的关键困难在于我们只观察到和之间的一个值,而我们想要估计。总有一个未观察到的值。
这是我的问题:为什么我们不简单地使用处理的样本来回归,并且类似地使用处理的样本来回归,并且将它们结合起来估计?
从这个角度来看,因果推理只是两个回归问题,不需要被视为一个特殊领域。我确信一定有什么问题,但它是什么?
一个现实生活中遇到问题的例子:有心脏病发作史的人服用各种药物,如 β 受体阻滞剂。患者状态越严重,就越像是给他们开了药。如果您对患者不太了解,只是在最近接受了一群心脏病发作的患者,您会发现服用 β 受体阻滞剂的人的结果更差(尽管随机试验显示 β 受体阻滞剂有益处) )。这个问题被称为混淆指征。
您现在必须以某种方式解释这样一个事实,即服用该药的人平均而言,未经治疗的预期结果比未服用该药的人要差得多。
适当地处理这是我们试图处理的事情,并根据反事实结果来制定这个问题有助于理解正在发生的事情。本质上,您需要考虑患者的预后(从治疗医师的角度)。很多时候,这里的一个大问题是数据可用性。即使您有一些可用的测量值,您可以以某种方式将其纳入预测,您也可能会错过数据库中未捕获的信息或很难转化为定量的信息(例如自由文本描述) .
根据存在的因果关系的性质,您的程序需要有一些注意事项。
案例1:混杂因素。检查这个因果图:
这里设置了一条后门路径如果你回归你会与混杂并且你不会得到和之间正确的因果关系。假设线性回归是正确的方法,您需要在回归这有效地以从而阻止信息流过后门路径。
案例2:调解员。检查这个因果图:
现在你有一个中介,如果你要回归(认为情况与案例 1 中的混杂因素相同)对的错误因果效应。为什么是那?因为在这种情况下没有从到的后门路径,并且通过调节您关闭了通过调节的附加效应。顺便说一下,有一些重要的反事实分析中介物的方法值得学习。参见,例如,统计中的因果推断: Pearl、Glymour 和 Jewell 的入门。
因此,传统的回归理论并没有以这种方式讨论因果关系,也没有后门路径的因果机制来告知何时在回归中包含变量,或者不包含变量。
也许更基本的是,回归本身甚至不会告诉您哪些变量是原因,哪些是结果!你可以回归认为是原因,是结果,或者你可以回归颠倒角色。你怎么知道哪一个是对的?因果关系中实际上有一个定理:模型、推理和推理,Pearl 的定理 1.2.8 在这里适用。事实证明和在观察上是等价的:相同的骨架和相同结构(不存在),这意味着令人吃惊的结论:你无法在统计上区分和换句话说,仅凭数据无法帮助您确定箭头的方向。
最后,当然,所讨论的变量可能根本不以回归风格的方式相关。如果任何类型的线性回归或任何类型的逻辑回归都不能捕捉到和示例:在
这是在线性回归和逻辑回归之外,因为所需的系数不会在表达式中线性显示。但是在这个结构方程模型中,我们清楚地认为对
因此,由于这些原因,因果图和因果思维,虽然它们当然可以应用于回归情况,但不能作为一种特殊情况简化为回归情况。
您说因果推断只是一个回归问题,并且您提出了一个因果效应的估计量。但是你有什么理由可以声称这种影响是因果关系?这是你估计因果关系的唯一方法吗?这是您可以估计的唯一因果关系吗?是否满足了所有因果(更不用说统计!)假设,可以让您将这种影响解释为因果关系?
您描述的策略是估计因果效应的一种方法。它被称为参数 g 公式或回归估计。有关使用该方法的介绍,请参见Snowden、Rose 和 Mortimer (2011) 。此方法在调整后估计对的平均边际效应。还有许多其他方法可以估计平均边际效应,包括匹配和加权(有或没有倾向得分)。使用这些方法没有什么本质上是因果关系。这些只是统计调整的方法,允许您对协变量的分布进行积分,以得出一个边际效应估计值,该估计值已经纯化了它与协变量的关系。
因果推断促使使用此类估计量,因为因果效应通常被定义为平均边际效应。您无需诉诸因果推理概念即可使用这些估计器,但它们通常在其他方面的效用有限。这些方法的统计特性不依赖于经常被调用来使用它们的因果假设。从这个意义上说,开发用于估计平均边际效应和调整其他协变量的相关量的统计方法不一定是因果推理领域的任务。这是统计学、计量经济学和生物统计学的任务。
因果推理领域涉及列举将估计的关系解释为因果关系所需的假设和条件。这包括发展对反事实、混杂、因果图、有效性威胁、概括性、可迁移性、因果估计、干扰、中介、测量误差等的理解。因果推理是一个极其广泛和富有成效的领域,其贡献远远超出了协变量调整量的统计估计。因果推理领域将统计量与因果量联系起来。
要专门解决您描述的方法,它存在问题。如果您未能正确估计协变量与结果之间的关系怎么办?如果您的协变量测量有误怎么办?如果协变量中缺少数据怎么办?如果没有观察到结果怎么办?如果有多个治疗期怎么办?如果您控制的变量会导致偏差而不是减少偏差怎么办?如果您没有包括所需的变量来估计感兴趣的数量怎么办?如果您希望您的估计推广到与您拥有的人群不同的人群怎么办?如果观察到的关系仅由于您的样本选择策略而存在怎么办?已经开发了统计方法来解决所有这些问题,而回归估计不能解决所有这些问题。致力于开发因果推理方法的统计领域已经考虑了所有这些问题,并开发了一套不断增长的方法来处理这些问题。它通常比“简单的专业回归问题”复杂得多。
其他答案讨论了您的具体建议可能会如何失败,但我认为一些更高级别的评论可能会有所帮助。
一般来说,要发现因果关系,我们需要进行干预。
一个典型的例子是温度-海拔关系。我们知道这两者是相关的(温度越高越冷),但我们怎么知道是什么原因造成的呢?黄金标准是进行一项实验,我们实际操作一个并检查另一个。我们会发现,改变高度确实会改变温度,但改变温度并不会改变高度。这是反事实的想法 - 检查 1) 实例化原因会产生结果,以及 2) 不实例化原因不会产生结果(即使移除公鸡,太阳仍然会升起)。
以所有可能的方式操纵所有变量的实验可以让我们识别因果关系。我想说,建立因果关系的关键困难在于,这种综合性的实验很难做到。例如,变量可能太多(只有 10 个二元变量有 1024 种可能的组合),干预可能非常困难(例如,针对单个细胞,而其他所有细胞不受影响),或不道德(检查吸烟是否会导致健康问题需要强迫一些人吸烟,检查健康是否会导致吸烟,我们将回报操纵人们的健康水平!)。
因此,在实践中,我们经常尝试从非完全随机的实验和/或纯粹的观察数据中发现因果关系。您的建议是尝试这样做的一种方式。这是相当合理的,但正如其他人所指出的,仅在特殊情况下才有效。还有其他方法可以尝试这样做,这是一个活跃的研究领域(参见例如 Mooji、Peters 等人 2015(使用观察数据区分因果关系:方法和基准)