格兰杰和珀尔因果关系框架之间的主要区别是什么?

机器算法验证 随机过程 因果关系 格兰杰因果关系
2022-02-10 17:16:50

最近,我遇到了几篇提到格兰杰因果关系的论文和在线资源。浏览相应的维基百科文章给我的印象是,这个术语指的是时间序列(或更一般地说,随机过程)上下文中的因果关系。此外,阅读这篇精彩的博客文章会在如何查看这种方法方面产生额外的困惑。

我绝不是一个了解因果关系的人,因为我对这个概念的模糊理解包括部分常识、常识、对潜变量建模结构方程建模 (SEM)的一些接触,并阅读了一些 Judea Pearl 的关于因果关系——不是他的书,而是更像是珀尔(2009)的一篇有趣的概述论文,出于某种原因,令人惊讶的是,它根本没有提到格兰杰因果关系。

在这种情况下,我想知道格兰杰因果关系是否比时间序列(随机)框架更普遍,如果是这样,基于结构因果模型( SCM),据我了解,它又基于直接无环图(DAG)反事实考虑到动态因果建模(DCM)的存在,格兰杰因果关系似乎可以归类动态系统因果推理一般方法方法(Chicharro 和 Panzeri,2014 年)。但是,我担心是否(如果可以,如何)可以比较这两种方法,其中一种是基于随机过程分析,另一种则不是。

更一般地说,您认为在一个综合因果关系框架内(作为不同的观点)考虑所有当前存在的因果关系理论的明智的高级方法(如果可能的话)是什么?这个问题很大程度上是由于我试图阅读 Chicharro 和 Panzeri (2014) 的一篇优秀而全面的论文以及回顾加州大学伯克利分校的一门有趣的因果推理课程 (Petersen & Balzer, 2014) 引发的。

参考

Chicharro, D. 和 Panzeri, S. (2014)。用于分析大脑区域之间有效连接的因果推理算法。神经信息学前沿,8 (64)。doi: 10.3389/fninf.2014.00064 检索自http://journal.frontiersin.org/article/10.3389/fninf.2014.00064/pdf

珍珠,J. (2009)。统计中的因果推理:概述。统计调查,3,96-146。doi:10.1214/09-SS057 取自http://projecteuclid.org/download/pdfview_1/euclid.ssu/1255440554

Petersen, M. 和 Balzer, L. (2014)。因果推理简介。加州大学伯克利分校。[网站] 检索自http://www.ucbbiostat.com

2个回答

格兰杰因果关系本质上对预测有用:如果使用 X 和 Y 的历史可以比单独使用 Y 的历史更好地预测 Y,则称 X 是格兰杰导致 Y。GC 与 Pearl 反事实意义上的因果关系几乎没有关系,后者涉及对可能发生的世界不同状态的比较。所以偷看格兰杰导致复活节,但他们没有导致它。当然,在一个除了 X 之外没有其他潜在原因的世界中,这两者会重叠,但这不是一个很可能的设置,而且从根本上来说是不可测试的。另一种限制较少的方式可以使它们一致,如果以 Y 和 X 的已实现历史为条件,则 X 的下一个实现与潜在结果无关。这一点在 Lechner, M. (2010), “The Relation of different Concepts of Causality Used in Time Series and Microeconometrics,” Econometric Reviews , 30, 109-127 ( WP link ) 中提出,写在潜在结果框架中,而不是 Pearl 的 DAG。

附录:让我更明确地提出一个隐含的假设。我的主张的关键因素是复活节没有固定的日期。假设您对复活节一无所知,并想预测明年的日期。从历史数据(Y 的历史)可以看出,复活节发生在春天。但我们能做得更好吗?使用假期附近的 Peeps 销售或营销数据 (X),我们可以看到 Peeps 是 Grange 造成的,因为该数据对于更准确地预测复活节很有用。

推论是圣诞树销售不会导致圣诞节,因为如果你知道几个世纪以来圣诞节都在 12 月 25 日举行(调整各种日历改革和教会分裂),圣诞树销售也无济于事。

珀尔提供了推理因果关系的演算,格兰杰提供了发现潜在因果关系的方法。我将详细说明:

珀尔的工作基于他所谓的“结构因果模型”,即三元组 M = (U, V, F)。在此模型中,U 是外生(背景或驱动)未观察到的变量的集合,V 是内生(由 U 和 V 中的变量以某种方式确定)变量的集合,F 是函数 f1、f2、 ...,对于 V 中的每个 Vi。变量 Vi 完全确定为 Vi = fi(U, V \ Vi),即 fi 的参数是 U 中的一些变量,以及 V 中的一些变量,但不是 Vi 本身。为了将其转换为概率模型,U 增加了一个概率分布。举个例子,U1 是法院对一个人的处决命令,V 是上尉 (V1) 和两名步枪手 (V2, V3) 在行刑队中以及法院命令所涉及的人的生/死状态 (V3)。如果法官下令开枪(U1 = '执行'),那么这会导致上尉发出开火命令,这会导致步枪兵向囚犯开枪,从而导致他的死亡。如果法庭没有下达命令,上尉保持沉默,步枪手不开枪,囚犯就活下来了。

珀尔认为,他的模型如何用于推理因果关系、设计实验、预测干预效果以及回答反事实问题。干预不同于概率论中的任何事物。在进行干预时,我们与模型交互并保持变量不变(这不仅仅是观察变量处于特定状态,就像概率条件反射一样),Pearl 描述了如何对模型“执行手术”,以便预测这种干预的结果。反事实更难回答,因为我们想知道如果不是这样,实验的结果会是什么,即使是这样。这就是珍珠模型的意义所在。

另一方面,格兰杰因果关系是一种统计方法,并不试图“证明”因果关系。如果我们有一大堆过程,我们可以使用格兰杰因果关系来获得“可能的因果关系”图,这可能被解释为潜在的真正原因,或者提供它们相互关联的度量,或者检测能量或信息的流动进程之间。在字面因果关系的情况下,您可以想象一种情况,其中实验(珍珠的方法所必需的)非常昂贵。在这种情况下,您可能仍然可以观察系统并应用格兰杰因果关系将事情缩小到潜在原因。完成此操作后,您可以对在何处分配额外资源有所了解。

在阅读 Pearl 的因果模型时,立即想到的一个问题是“如何构建模型?”。这将通过结合领域专业知识和假设来实现,但格兰杰因果关系也可能提供更多关于如何构建珍珠因果模型的信息。

由于我没有足够的声誉来发表评论,因此我将在这里添加对 Dimitriy V. Masterov 的回答的批评:Peeps do Granger-Cause Easter。复活节周期性地发生,即使窥视的发生与复活节的发生密切相关,但复活节发生的历史足以预测它的未来发生。有关 Peeps 的信息不会添加有关复活节的任何其他信息。我认为这是一个关键点:格兰杰因果关系不仅仅是相关性。相关的过程可能没有任何 Granger-Causal 关系,而具有 Granger-Causal 关系的过程可能不相关。