如果没有遗漏变量,是回归因果关系吗?

机器算法验证 回归 偏见 因果关系
2022-02-27 02:03:37

的回归不一定是因果关系但如果不是因为遗漏变量和测量误差,是回归因果吗?也就是说,如果每个可能的变量都包含在回归中?yxxy

2个回答

不,不是,我会给你一些反例。

一是逆因果考虑因果模型是,其中是标准高斯随机变量。然后,因为不会导致,但将取决于YXXYE[Y|do(x)]=0XYE[Y|x]X

第二个例子是控制对撞机(见这里)。考虑因果模型,即不会导致是常见原因。但请注意,如果您运行包含的回归系数不会为零,因为基于共同原因的条件会导致之间的关联(您可能还想在这里看到存在的路径分析条件对撞机)。XZYXYZZXYX

更一般地,如果回归中包含的变量满足后门标准的回归将是因果关系YX

除了 Carlos Cinelli 对这个问题的重要回答之外,还有其他一些原因表明回归系数可能不是因果关系。

首先,模型错误指定可能导致参数是非因果的。仅仅因为您的模型中有所有相关变量并不意味着您已经以正确的方式对它们进行了调整。作为一个非常简单的例子,考虑一个围绕 0 对称分布的变量假设您的结果变量的影响,使得然后在上回归(而不是在上)将给出的所有(唯一)变量XYXE(YX)=X2YXX2XY

其次,与反向因果关系相关,还有可能存在选择偏差的风险,即您的样本的选择方式不能代表您希望推断的人群。此外,如果数据没有完全随机缺失,缺失数据也会引入偏差。