我应该知道哪些因果关系理论?

机器算法验证 机器学习 因果关系 数理统计 治疗效果
2022-01-21 20:20:03

作为应用统计学家/计量经济学家,我应该知道哪些因果关系的理论方法?

我知道(一点点)

我错过或应该注意哪些概念?

相关:哪些理论是机器学习因果关系的基础?

我已经阅读了这些有趣的问题和答案(123),但我认为这是一个不同的问题。例如,我很惊讶地看到“统计学习要素”中没有提到“因果关系” 。

1个回答

严格来说,“格兰杰因果关系”根本不是因果关系。这是关于预测能力/时间优先级的,您想检查一个时间序列是否对预测另一个时间序列有用——它适用于诸如“通常 A 发生在 B 发生之前”或“知道 A 帮助我预测 B 会发生”之类的声明,但不是相反”(即使在考虑了所有关于的过去信息之后)。这个名字的选择是非常不幸的,它是几个误解的原因。B

虽然原因必须在时间上先于其结果几乎没有争议,但要得出具有时间优先性的因果结论,您仍然需要声明没有混淆,以及其他虚假关联的来源。

现在关于潜在结果(Neyman-Rubin)因果图/结构方程建模(Pearl),我会说这是一个错误的困境,你应该同时学习。

首先,重要的是要注意这些并不是关于因果关系的相反观点正如 Pearl 所说,关于(因果)推理任务有一个层次结构:

  1. 观测预测
  2. 干预下的预测
  3. 反事实

对于第一个任务,您只需要知道观察到的变量的联合分布。对于第二个任务,您需要了解联合分布和因果结构。对于反事实的最后一项任务,您将进一步需要有关结构方程模型的函数形式的一些信息。

因此,在谈论反事实时,两种观点之间存在形式上的对等不同之处在于,潜在结果将反事实陈述作为原语,而在 DAG 中,反事实似乎来自结构方程。但是,您可能会问,如果它们是“等价的”,为什么还要学习两者呢?因为在表达和派生事物的“容易程度”方面存在差异。

例如,尝试仅使用潜在结果来表达M-Bias的概念——我从未见过好的结果。事实上,到目前为止,我的经验是,从未研究过图表的研究人员甚至都没有意识到这一点。此外,用图形语言对模型进行实质性假设将使计算更容易得出其经验可测试的含义并回答可识别性问题。另一方面,有时人们会发现更容易首先直接考虑反事实本身,并将其与参数假设结合起来以回答非常具体的问题。

可以说的还有很多,但这里的重点是你应该学习如何“说两种语言”。如需参考,您可以在此处查看如何开始。