是否有任何理论或研究领域关注建模因果关系而不是相关性?

机器算法验证 因果关系 模型
2022-01-22 13:16:18

我的理解是概率(至少从常客的角度来看)是一种用于建模相关性的数学工具。因此,例如,我们可以说两个事件XY被定义为独立的,如果P(XY)=P(X)P(Y), 或等效地P(X|Y)=P(X), 等等。但是,诸如是否P(X|Y)=P(X)没有告诉我们因果关系。这让我想到了这篇文章所要讨论的问题。

是否有任何类型的理论或数学研究领域与建模因果关系有关?

我怀疑有两种可能的答案。首先是可能存在特定于特定研究领域(生物学、物理学、经济学)的专门模型。第二个可能是一些类似于构造子理论的广义抽象理论,老实说只有数学家才会想到。

任何可能形式的答案将不胜感激。

4个回答

新因果革命有两种主要方法。一种是由 Judea Pearl 倡导的图形方法(如有向无环图)。另一个是潜在结果框架,由唐纳德·鲁宾(Donald Rubin)倡导。

对于图形方法,我按以下顺序推荐这些书籍:

  1. 《为什么之书》,Pearl 和 MacKenzie 着。先决条件:介绍性统计。
  2. 统计中的因果推理:入门,Pearl、Glymour 和 Jewell。先决条件:数理统计。
  3. 因果关系:模型、推理和推理,Pearl。这本书非常难(我没有读过,虽然我略读了几部分)但里面几乎所有的东西。本书中没有的一项最新发展是最大祖先图方法。先决条件:贝叶斯网络,数理统计。

对于潜在结果框架,主要书籍似乎是Rubin 和 Imbens的《统计、社会和生物医学科学的因果推理:简介》。我还没读过。

这两种方法有不同的优点和缺点,但正如 Carlos 在他的评论中指出的那样,它们在理论上是通过结构因果建模统一起来的。

因果推理是统计推理的一部分,属于统计领域因果推断通常需要在适当的实验结构下推断统计关联,该结构将统计关联限制在某些结构中。这在着眼于因果关系和概率相互作用的专业书籍中得到了解决,最值得注意的是 Judea Pearl 的优秀作品(例如,Pearl 2009Pearl 2015Pearl、Glymour 和 Jewell 2016)以及潜在结果框架唐纳德·鲁宾(参见例如,Holland 1986Rubin 1991Rubin 2005)。珀尔批评统计界对这一材料的关注不够(见相关问题here),但他的作品仍然属于统计领域,它们可以适当地被视为对概率、因果关系和统计的接口的贡献。

正如您在阅读这些作品中所看到的那样,可以通过添加一个运算符来表示系统中的动作/干预(称为“do”运算符)来增强传统概率论,这允许因果关系在分析中构建公理水平。这是对传统概率论的有用扩展。目前,学生的统计学课程并没有包含很多此类材料,除了一些在课程后期出现的专业课程。我希望概率论的这种扩展最终会以一种更有凝聚力的方式融入到统计课程中,以便学生在他们的统计研究中更早地流利地进行因果推理,而不是将其视为他们的附加内容。只是在他们职业生涯的后期才遇到。

Adrian Keister 提供了一个很好的答案。我的回答继续他的。我花了一段时间才意识到因果推理的两种不同方法(图形方法和潜在结果)是互补的。为了更好地理解这两种因果推理方法如何协同工作,我建议阅读Morgan & Winship “Counterfactuals and Causal Inference”从本书中,您将了解到估计因果效应的三种主要方法:1)后门标准,2)工具变量,3)前门标准。

虽然有 3 种方法,但绝大多数计量经济学和社会科学领域的因果推理期刊文章使用方法#2:工具变量。顺便说一句,对于工具变量方法,DAG 在许多方面是不必要的,因为它总是具有相同的骨架并且可以很容易地用文字来描述。有人可能会说,对于 IV,DAG 至关重要。是的,因为它必须看起来像下面的那个(Z 是仪器)。但是既然所有的 IV DAG 都必须是这样的,那么 DAG 在 IV 中的重要性以及它除了作为一个漂亮的可视化之外还有什么作用呢?在此处输入图像描述DAG 对于方法#1:后门标准至关重要。但在实践中,很难令人信服地证明已经构建了合适的 DAG。在计量经济学或社会科学中,您几乎找不到使用这种方法的期刊文章。如果你这样做了,它几乎肯定不会包含 DAG。从我所见,这种方法在医学领域经常被成功使用。对于方法#3:前门标准,DAG通常比较简单,只有几个前门路径,因此可以很容易地用文字描述。因此,归根结底,图形方法是一个不错的附加功能,但除非您使用后门标准(我发现在医学领域之外很少见)或精心设计的前门标准(也相对罕见)DAG 并不重要。相比之下,潜在结果框架是因果推理的本质基础,坦率地说,没有它你甚至无法定义因果推理。Angrist 和 Pischke 的两本书无疑是对潜在结果方法(计量经济学和社会科学)的最佳介绍;Hernan 和 Robins 的书似乎也很受重视,尤其是在公共卫生/医学领域(但我还没有完整阅读)。我认为图形方法阵营最有价值的贡献是提高对碰撞变量的认识;它的一些影响(例如内生选择偏差)是至关重要的,是跨学科因果推理的首要考虑因素。没有它,甚至无法定义因果推理。Angrist 和 Pischke 的两本书无疑是对潜在结果方法(计量经济学和社会科学)的最佳介绍;Hernan 和 Robins 的书似乎也很受重视,尤其是在公共卫生/医学领域(但我还没有完整阅读)。我认为图形方法阵营最有价值的贡献是提高对碰撞变量的认识;它的一些影响(例如内生选择偏差)是至关重要的,是跨学科因果推理的首要考虑因素。没有它,甚至无法定义因果推理。Angrist 和 Pischke 的两本书无疑是对潜在结果方法(计量经济学和社会科学)的最佳介绍;Hernan 和 Robins 的书似乎也很受重视,尤其是在公共卫生/医学领域(但我还没有完整阅读)。我认为图形方法阵营最有价值的贡献是提高对碰撞变量的认识;它的一些影响(例如内生选择偏差)是至关重要的,是跨学科因果推理的首要考虑因素。特别是在公共卫生/医学领域(但我还没有完整阅读)。我认为图形方法阵营最有价值的贡献是提高对碰撞变量的认识;它的一些影响(例如内生选择偏差)是至关重要的,是跨学科因果推理的首要考虑因素。特别是在公共卫生/医学领域(但我还没有完整阅读)。我认为图形方法阵营最有价值的贡献是提高对碰撞变量的认识;它的一些影响(例如内生选择偏差)是至关重要的,是跨学科因果推理的首要考虑因素。

我最喜欢的资源:

(图表来源:https ://donskerclass.github.io/EconometricsII/ControlandIV.html )

简单的回答。是的——科学方法可以帮助发现和确认因果关系。它需要一个假设,然后是一个受控实验,然后是一个(经过统计验证的)结论。随着收集数据以支持该假设,“x”导致“y”变得越来越确定。