统计独立性是否意味着缺乏因果关系?

机器算法验证 独立 因果关系 贝叶斯网络 达格
2022-01-21 15:08:51

两个随机变量 A 和 B 在统计上是独立的。这意味着在过程的 DAG 中:当然还有但这是否也意味着从 B 到 A 没有前门?(AB)P(A|B)=P(A)

因为那时我们应该得到那么,如果是这样的话,统计独立性是否自动意味着缺乏因果关系?P(A|do(B))=P(A)

3个回答

那么,如果是这样的话,统计独立性是否自动意味着缺乏因果关系?

不,这里有一个多元法线的简单反例,

set.seed(100)
n <- 1e6
a <- 0.2
b <- 0.1
c <- 0.5
z <- rnorm(n)
x <- a*z + sqrt(1-a^2)*rnorm(n)
y <- b*x - c*z + sqrt(1- b^2 - c^2 +2*a*b*c)*rnorm(n)
cor(x, y)

有了相应的图表,

在此处输入图像描述

这里我们有是边缘独立的(在多元正常情况下,零相关意味着独立)。发生这种情况是因为通过的后门路径完全抵消了从的直接路径,即因此然而,直接导致,我们有,它不同于xyzxycov(x,y)=bac=0.10.1=0E[Y|X=x]=E[Y]=0xyE[Y|do(X=x)]=bxE[Y]=0

关联、干预和反事实

我认为在这里对关联、干预和反事实进行一些澄清是很重要的。

因果模型需要关于系统行为的陈述:(i)在被动观察下,(ii)在干预下,以及(iii)反事实。一个层面的独立性并不一定会转化为另一个层面。

如上例所示,我们可以在之间没有关联,即,并且仍然是对的操作会改变的分布的情况,即XYP(Y|X)=P(Y)XYP(Y|do(x))P(Y)

现在,我们可以更进一步。我们可以有因果模型,其中干预不会改变的总体分布,但这并不意味着缺乏反事实因果关系!也就是说,即使,对于每个人也会有所不同这正是 user20160 所描述的情况,以及我之前的回答XYP(Y|do(x))=P(Y)YX

根据回答每个问题所需的信息,这三个级别构成了因果推理任务的层次结构。

假设我们有一个由两个开关控制的灯泡。S1S2表示开关的状态,可以是 0 或 1。让L表示灯泡的状态,可以是 0(关闭)或 1(打开)。我们设置电路,使灯泡在两个开关处于不同状态时打开,而在它们处于相同状态时关闭。因此,电路实现了异或功能:L=XOR(S1,S2).

通过施工,L有因果关系S1S2. 给定系统的任何配置,如果我们拨动一个开关,灯泡的状态就会改变。

现在,假设两个开关都根据伯努利过程独立启动,其中处于状态 1 的概率为 0.5。所以,p(S1=1)=p(S2=1)=0.5, 和S1S2是独立的。在这种情况下,我们从电路的设计中知道P(L=1)=0.5而且,此外,p(LS1)=p(LS2)=p(L). 也就是说,知道一个开关的状态并不能告诉我们灯泡是打开还是关闭。所以LS1是独立的LS2.

但是,如上所述,L有因果关系S1S2. 因此,统计独立性并不意味着缺乏因果关系。

根据你的问题,你可以这样想:

P(AB)=P(A)P(B)什么时候AB是独立的。你可以类似地暗示

P(AB)/P(A)=P(B|A)=P(B). 还,

P(AB)/P(B)=P(A|B)=P(A).

在这方面,我认为独立意味着缺乏因果关系。然而,依赖并不一定意味着因果关系。