机器算法验证 - 所有统计模型都是因果模型吗？ - 吾爱随笔录

所有统计模型都是因果模型吗？

机器算法验证回归因果关系结构方程建模图形模型

2022-03-25 23:46:02

我刚刚开始学习因果推理方法，重点是 Pearl 的 do-calculus。因此，珀尔的因果图与操纵因果图的规则之间的关键点似乎是将因果图转化为统计模型（例如线性回归）。

所以你可能有一个因果图，例如 $Z \rightarrow X, X \rightarrow M, M \rightarrow Y, Z \rightarrow Y$ （Z 是 X 和 Y 的混杂因素，但 X 也部分导致 Y 到 M）。

如果我的目标是找出 X 对 Y 的因果影响，而我只是做了一个幼稚的事情并设置了一个 $Y = aX + e$ 的线性回归并试图估计一个回归系数，那么我当然会得到一个有偏差的估计到混杂 Z 的存在。另一方面，如果我做 $Y = aX + bM + cZ + e$ ，那么我将通过调节中介 M 来阻止 X 的影响。所以再次，知道因果图会告诉我以 Z 而不是 M 为条件，即 $Y = aX + cZ + e$ 是正确的统计模型，它允许我估计因果效应。

但是 $Y = aX + cZ + e$ （作为回归模型，而不是数学方程）也是因果模型（尽管是“错误的”因果模型）吗？如果我操纵 $X$ $Y$ 会发生什么。它不对应于因果图 $X \rightarrow Y, Z \rightarrow Y$ 吗？如果是这样，那么 Pearl 方法是否只是将因果图转换为另一个更易于使用或表示为回归的因果图？

编辑：我认为我在这个简单示例中的因果图分析是错误的，但希望更广泛的观点仍然清楚

编辑＃2：

如果我用编程语言编写模型 $Y + aX + bZ + e$ ，我可以将其作为函数来执行，例如在 Python 中

 def model(a,X,c,Z):
     return a*X + b*Z + np.random.randn()

所以如果我改变输入 $X$ ，它会导致 $model(...)$ 的输出改变，但我不能做相反的事情。这不是因果模型吗？

3个回答

但是（作为回归模型，而不是数学方程）也是因果模型（尽管是“错误的”因果模型）吗？如果我操纵会发生什么。它不对应于因果图吗？ $Y = aX + cZ + e$ $X$ $Y$ $X \rightarrow Y, Z \rightarrow Y$

它可能对应于因果图 ... $X \rightarrow Y, Z \rightarrow Y$

...但它也可以是。 $Y \rightarrow X, Y \rightarrow Z$

只要有因果模型，就会出现统计模型，但这些统计模型与因果模型本身并不等价/相同。

统计模型只描述相关性，而不（不需要）描述因果关系。您可以描述和拟合统计模型，而无需描述潜在的因果模型。

或者至少，当然单独的统计模型并不能告诉你任何有关因果关系的信息（除了存在一些潜在的因果机制，但我们不知道是哪一个）。从这个意义上说，它不等同于因果模型。

您可以将统计模型视为因果模型的影子。

编辑

如果我用编程语言编写模型，我可以将其作为函数来执行，例如在 Python 中 $Y + aX + bZ + e$
 def model(a,X,c,Z):
     return a*X + b*Z + np.random.randn()```

在这种情况下，您正在编程因果模型而不是统计模型。您专门将随机噪声定义为添加到a*X+b*Z. 但这并不一定是为了得到一个关系：

Y | X, Z \sim N (a X + b Z, σ^{2})

$Y|X,Z \sim N(aX + bZ, \sigma^2)$

考虑下面的数据

统计模型是 X 和 Y 服从二元分布。但是你能从中分辨出因果模型吗？我们有还是有？它们可以导致相同的统计分布，但因果模型不同。 $X = aY + \text{noise}$ $Y = aX +\text{noise}$

编辑：我认为我在这个简单示例中的因果图分析是错误的，但希望更广泛的观点仍然清楚

就您正确地确定 M 是中介而 Z 是混杂因素而言，您的分析是正确的。如果这是正确的因果模型（基于背景知识或因果发现），那么您只有一件事没有明确提及：X 不是 Y 的直接原因。由于中介效应，您可以测量一些总效应通过 M，但如果你控制 M，你可以使 X 和 Y 独立（马尔可夫性质）。

所有统计模型都是因果模型吗？

不，他们不是。

因此，珀尔的因果图与操纵因果图的规则之间的关键点似乎是将因果图转化为统计模型（例如线性回归）。

这种说法充其量是令人困惑的。珀尔作品的要点是明确区分：统计概念与因果概念。您的问题本身表明您还没有掌握这一点。事实上像下面这样的陈述

但是（作为回归模型，而不是数学方程）也是因果模型（尽管是“错误”的因果模型）吗？如果我操纵会发生什么。它不对应于因果图吗？如果是这样，那么 Pearl 方法是否只是将因果图转换为另一个更易于使用或表示为回归的因果图？ $Y=aX+cZ+e$ $X$ $Y$ $X→Y,Z→Y$

肯定地确认我的印象。

除了回归方程仍然是一个受人尊敬的数学方程（太多笼统的概念）之外，因果图不代表一些回归。更糟糕的是，操纵的（因果）概念不适用于回归。事实上，因果图代表结构方程，它们必须与回归方程清楚地分开。确实，Pearl 反复强调了使用不同符号的机会。

如果我用编程语言编写模型 Y+aX+bZ+e，我可以将其作为函数来执行，例如在 Python 中

它看起来像一个因果模型。之所以如此，是因为编程语言所要求的定义意味着一种具有定义性的等号（），它不同于标准的等号（）。标准等号在逻辑上是对称的，另一个不是，正是由于这个原因，它是结构方程（因果概念）所需要的。 $:=$ $=$

也就是说，因果模型和统计模型之间的主要联系是关于识别（在这里阅读：为什么我们需要在因果推理中进行识别？）。为了识别目的，Pearl 建议使用 do-calculus（在此处阅读：do-calculus 的目的是什么？）

有关更多详细信息，请阅读此处：

在哪些假设下可以因果解释回归？

对珀尔因果论的批判

其它你可能感兴趣的问题

上一篇重新采样小型数据集 - 过度计数的问题？下一篇我对 Metropolis 采样算法的理解是否正确？