反向因果关系相反的定义

机器算法验证 因果关系 定义 达格
2022-04-11 23:27:45

我有三个来源,它们都描述了不同的 DAG 结构,但都声称它们的结构正是相反的因果关系

s0

在此处输入图像描述

s1(第 84 页)开始:

在此处输入图像描述

s2

在此处输入图像描述

其中哪一个是正确的?

1个回答

反向因果关系对于 DAG 尤其成问题,因为它通常意味着因果路径的反转或反馈循环(这将使其成为有向循环图)导致通常的 DAG 分析无效。

尽管如此,即使存在或怀疑存在反向因果关系,使用 DAG 仍然可以说很多话。你说

然而所有人都声称它们的结构恰恰是相反的因果关系:

他们没有声称他们的 DAG 结构是反向因果关系的唯一结构,只是说它是反向因果关系的一个例子。

在第一种情况下,我不同意这是反向因果关系。肾功能衰竭和镇痛药都是由糖尿病引起的,因此这是一个混杂的情况,而不是反向因果关系。我看不出有任何理由在他们所做的方向上绘制箭头。我希望虚线根本没有箭头,表明两者是相关的。

在第二种情况下,DAG 是一种通用的 DAG,经常出现在未测量的混杂情况下。同样,我不同意存在任何反向因果关系,即使从他们的描述来看:

亚临床疾病 U 导致缺乏运动 A 和临床疾病 Y 的风险增加。当 L 未知时,这种形式的混杂通常被称为反向因果关系。

我不同意这一点。当 L 也未被观察到时,U 直接导致 A 和 Y,这又是它们对混淆的标准定义。对于较高的 U,运动量减少,死亡风险增加,Y。我在这个论点中看不到任何反向因果关系。

第三种情况很有趣,因为它有一个双向弧(因果指向双向,这意味着它不是 DAG。无论如何就是我通常理解的反向因果关系。吸烟会在以后的生活中导致癌症。这是无可争议的。然而,被诊断出患有肺癌的吸烟者随后会减少或停止吸烟,这是被诊断出的直接后果,因此箭头也指向另一个方向。理解这一点的一种方法是认识到导致他们戒烟的不是肺癌本身。这是诊断。肺癌在诊断之前就已经存在。诊断也不是肺癌引起的,而是肺癌引起的症状导致患者得到诊断,是诊断导致减少或停止吸烟:

在此处输入图像描述

当然,这在 DAG 理论中仍然是一个问题,因为我们现在有一个反馈回路,因为诊断导致吸烟。解决此问题的一种方法是将吸烟变量拆分为诊断前吸烟和诊断后吸烟:

在此处输入图像描述

除了保持非循环性之外,这样做的一个优点是它保持了 DAG 的时间性质——也就是说,时间较早发生的变量在左侧,而较晚发生的变量在右侧。这明确地承认了因果关系的定义特征之一:为了使某事物成为原因,它必须发生在它是原因的事物之前。这不是 DAG 理论中强制执行的事情,但它是一种非常好的实践,可以在这种情况下提供帮助。