机器算法验证 - 统计独立性是否意味着缺乏因果关系？ - 吾爱随笔录

统计独立性是否意味着缺乏因果关系？

机器算法验证独立因果关系贝叶斯网络达格

2022-01-21 15:08:51

两个随机变量 A 和 B 在统计上是独立的。这意味着在过程的 DAG 中：当然还有。但这是否也意味着从 B 到 A 没有前门？ $(A {\perp\!\!\!\perp} B)$ $P(A|B)=P(A)$

因为那时我们应该得到。那么，如果是这样的话，统计独立性是否自动意味着缺乏因果关系？ $P(A|do(B))=P(A)$

3个回答

那么，如果是这样的话，统计独立性是否自动意味着缺乏因果关系？

不，这里有一个多元法线的简单反例，

set.seed(100)
n <- 1e6
a <- 0.2
b <- 0.1
c <- 0.5
z <- rnorm(n)
x <- a*z + sqrt(1-a^2)*rnorm(n)
y <- b*x - c*z + sqrt(1- b^2 - c^2 +2*a*b*c)*rnorm(n)
cor(x, y)

有了相应的图表，

这里我们有和是边缘独立的（在多元正常情况下，零相关意味着独立）。发生这种情况是因为通过的后门路径完全抵消了从到的直接路径，即。因此。然而，直接导致，我们有，它不同于。 $x$ $y$ $z$ $x$ $y$ $cov(x,y) = b - a*c = 0.1 - 0.1 = 0$ $E[Y|X =x] =E[Y] =0$ $x$ $y$ $E[Y|do(X= x)] = bx$ $E[Y]=0$

关联、干预和反事实

我认为在这里对关联、干预和反事实进行一些澄清是很重要的。

因果模型需要关于系统行为的陈述：（i）在被动观察下，（ii）在干预下，以及（iii）反事实。一个层面的独立性并不一定会转化为另一个层面。

如上例所示，我们可以在和之间没有关联，即，并且仍然是对的操作会改变的分布的情况，即。 $X$ $Y$ $P(Y|X) = P(Y)$ $X$ $Y$ $P(Y|do(x)) \neq P(Y)$

现在，我们可以更进一步。我们可以有因果模型，其中干预不会改变的总体分布，但这并不意味着缺乏反事实因果关系！也就是说，即使，对于每个人也会有所不同。这正是 user20160 所描述的情况，以及我之前的回答。 $X$ $Y$ $P(Y|do(x)) = P(Y)$ $Y$ $X$

根据回答每个问题所需的信息，这三个级别构成了因果推理任务的层次结构。

假设我们有一个由两个开关控制的灯泡。让 $S_1$ 和 $S_2$ 表示开关的状态，可以是 0 或 1。让 $L$ 表示灯泡的状态，可以是 0（关闭）或 1（打开）。我们设置电路，使灯泡在两个开关处于不同状态时打开，而在它们处于相同状态时关闭。因此，电路实现了异或功能： $L = \text{XOR}(S_1, S_2)$ .

通过施工， $L$ 有因果关系 $S_1$ 和 $S_2$ . 给定系统的任何配置，如果我们拨动一个开关，灯泡的状态就会改变。

现在，假设两个开关都根据伯努利过程独立启动，其中处于状态 1 的概率为 0.5。所以， $p(S_1=1) = p(S_2=1) = 0.5$ ，和 $S_1$ 和 $S_2$ 是独立的。在这种情况下，我们从电路的设计中知道 $P(L=1) = 0.5$ 而且，此外， $p(L \mid S_1) = p(L \mid S_2) = p(L)$ . 也就是说，知道一个开关的状态并不能告诉我们灯泡是打开还是关闭。所以 $L$ 和 $S_1$ 是独立的 $L$ 和 $S_2$ .

但是，如上所述， $L$ 有因果关系 $S_1$ 和 $S_2$ . 因此，统计独立性并不意味着缺乏因果关系。

根据你的问题，你可以这样想：

$P(A B) = P(A) P(B)$ 什么时候 $A$ 和 $B$ 是独立的。你可以类似地暗示

$P(AB)/P(A) = P(B|A) = P(B)$ . 还，

$P(AB)/P(B) = P(A|B) = P(A)$ .

在这方面，我认为独立意味着缺乏因果关系。然而，依赖并不一定意味着因果关系。

其它你可能感兴趣的问题

上一篇交叉验证如何克服过拟合问题？下一篇回归均值与赌徒谬误