这实际上是选择偏差的一个例子吗?

机器算法验证 自习 因果关系 达格 选择偏差
2022-04-05 14:10:07

在Miguel Hernán 关于因果图的 edX 课程的第 3 课第 3 章中,他介绍了这个 DAG:

在此处输入图像描述

它代表了一项关于激素治疗对肺癌的影响(激素治疗是否会导致肺癌)的研究。在波士顿的肺癌女性中,随机抽取了 1000 名样本进行研究。在波士顿没有肺癌的女性中,随机抽取了 1000 名样本进行研究。这解释了肺癌和选择之间的箭头(即基于结果的选择)。

然后他补充说,仅对患有髋部骨折的女性进行了调查(“她们无法逃避你”),这说明了髋部骨折和选择之间的箭头。

最后,他说激素疗法实际上降低了髋部骨折的风险,因此添加了激素疗法和髋部骨折之间的最后一箭,创造了一条开放的后门路径。

我的问题是,如果只对患有髋部骨折的女性进行调查,这是否意味着我们正在对髋部骨折进行调理?如果是这样,应该是髋部骨折周围有一个正方形,后门路径实际上是阻塞的,并且没有选择偏差。

2个回答

如果确实选择了患有髋部骨折的女性,那么髋部骨折与所选人群中的任何事物之间没有关联。这相当于说“在髋部骨折的女性中,髋部骨折与肺癌之间存在关联”。显然,这没有意义。关联需要两个变量的变化。您不能谈论变量和条件变量之间的关联。

如果他的意思是“患有髋部骨折的女性更有可能被选中”,那么正如 DAG 所显示的那样,不是以髋部骨折为条件,而是以选择为条件,这是由骨折引起的。他可能在视频中说错了,因为这显然是他的意思。

我的问题是,如果只对患有髋部骨折的女性进行调查,这是否意味着我们正在对髋部骨折进行调理?如果是这样,应该是髋部骨折周围有一个正方形,后门路径实际上是阻塞的,并且没有选择偏差。

请注意,即使 DAG 只是,干预后分布也不是非参数识别的,因为P你只观察到因此,如果您的目标估计是,即使没有路径也会存在选择偏差。AYCP(Y|do(A))P(Y|do(A))=P(Y|A)P(Y|A,C)P(Y|A,C=1)P(Y|do(A))AFC

对于选择偏差,您可能需要检查Bareinboim 和 Pearl以及最近的 Correa、Tian 和 Bareinboim。