统计和因果推理?

机器算法验证 因果关系
2022-01-21 05:54:44

在他 1984 年的论文“统计和因果推理”中,保罗·霍兰德提出了统计学中最基本的问题之一:

统计模型可以说明什么因果关系?

这导致了他的座右铭:

没有操纵就没有因果关系

这强调了对考虑因果关系的实验进行限制的重要性。Andrew Gelman 提出了类似的观点

“要找出当你改变某事时会发生什么,就必须改变它。”……有些东西你从扰乱系统中学到的东西,你永远不会从任何数量的被动观察中发现。

这篇文章总结了他的想法

从统计模型进行因果推断时应该考虑哪些因素?

3个回答

这是一个广泛的问题,但鉴于 Box、Hunter 和 Hunter 的名言是真实的,我认为归根结底是

  1. 实验设计的质量:

    • 随机化,样本量,混杂因素的控制,...
  2. 设计实施的质量:

    • 遵守协议、测量错误、数据处理……
  3. 模型的质量准确反映设计:

    • 块结构被准确地表示,适当的自由度与效果相关,估计器是无偏的,......

冒着陈述显而易见的风险,我将尝试抓住每个要点:

  1. 是统计的一个大子领域,但在它的最基本形式中,我认为归结为这样一个事实,即在进行因果推理时,我们理想地从在相同环境中监控的相同单元开始,而不是分配给治疗。分配后组之间的任何系统差异在逻辑上都可归因于治疗(我们可以推断原因)。但是,世界并没有那么美好,治疗前的单位不同,实验期间的环境也没有完全控制。所以我们“控制我们能做的,随机化我们不能做的”,这有助于确保不会因为我们控制或随机化的混杂因素而出现系统性偏差。一个问题是,实验往往是困难的(甚至是不可能的)和昂贵的,并且已经开发了多种设计以在考虑到成本的情况下在尽可能仔细控制的环境中有效地提取尽可能多的信息。其中一些是相当严格的(例如医学中的双盲、随机、安慰剂对照试验),而另一些则不那么严格(例如各种形式的“准实验”)。

  2. 这也是一个大问题,统计学家通常不会考虑……尽管我们应该考虑。在应用统计工作中,我可以回忆起在数据中发现的“影响”是数据收集或处理不一致的虚假结果的事件。我还想知道由于这些问题,有关感兴趣的真实因果影响的信息多久丢失一次(我相信应用科学专业的学生通常几乎没有接受过关于数据损坏方式的培训——但我在这里偏离了话题...)

  3. 是另一大技术课题,也是客观因果推理的又一必要步骤。这在一定程度上得到了解决,因为设计人群一起开发设计和模型(因为从模型推断是目标,估计器的属性驱动设计)。但这只能让我们走这么远,因为在“现实世界”中,我们最终会分析来自非教科书设计的实验数据,然后我们必须认真思考诸如适当的控制以及它们应该如何进入模型以及相关程度的问题。自由应该是,如果不满足假设是否满足,如何调整违规行为以及估计器对任何剩余违规行为的稳健性和......

无论如何,希望上面的一些内容有助于思考从模型中进行因果推理的考虑因素。我忘了什么大事吗?

统计模型可以说明什么因果关系?从统计模型进行因果推断时应该考虑哪些因素?

首先要明确的是,您不能从纯粹的统计模型中做出因果推断。没有因果假设,任何统计模型都无法说明因果关系。也就是说,要进行因果推理,您需要一个因果模型

即使在被视为黄金标准的情况下,例如随机对照试验 (RCT),您也需要做出因果假设才能继续进行。让我说清楚。例如,假设Z是随机化过程,X利益的处理和Y感兴趣的结果。当假设一个完美的 RCT 时,这就是您的假设:

在此处输入图像描述

在这种情况下P(Y|do(X))=P(Y|X)所以事情进展顺利。但是,假设您的合规性不完全,导致两者之间的关系混淆XY. 然后,现在,您的 RCT 如下所示:

在此处输入图像描述

您仍然可以进行意图处理分析。但是如果要估计实际效果X事情不再简单了。这是一个工具变量设置,如果您做出一些参数假设,您可能能够限制甚至指出影响

这可能会变得更加复杂。您可能会遇到测量错误问题、受试者可能会放弃研究或不遵循说明等问题。您需要对这些事物与推理的关系做出假设。对于“纯粹的”观测数据,这可能会带来更多问题,因为通常研究人员不会很好地了解数据生成过程。

因此,要从模型中得出因果推论,您不仅需要判断其统计假设,而且最重要的是判断其因果假设。以下是因果分析的一些常见威胁:

  • 不完整/不精确的数据
  • 未明确定义感兴趣的目标因果数量(您想要识别的因果效应是什么?目标人群是什么?)
  • 混杂(未观察到的混杂)
  • 选择偏差(自我选择,截断样本)
  • 测量误差(会引起混淆,而不仅仅是噪声)
  • 指定错误(例如,错误的函数形式)
  • 外部效度问题(对目标人群的错误推断)

有时,声称不存在这些问题(或声称已解决这些问题)可以通过研究本身的设计来支持。这就是为什么实验数据通常更可信的原因。然而,有时人们会用理论或为了方便来假设这些问题。如果理论是软的(如在社会科学中),就很难从表面上得出结论。

每当您认为存在无法支持的假设时,您都应该评估结论对于可能违反这些假设的敏感性——这通常称为敏感性分析。

除了上面的出色答案之外,还有一种统计方法可以让您更接近证明因果关系。格兰杰因果关系证明了一个自变量出现在一个因变量之前是否具有因果效应。我在以下链接中以易于理解的演示文稿介绍了此方法:

http://www.slideshare.net/gaetanlion/granger-causality-presentation

我还将这种方法应用于测试相互竞争的宏观经济理论: http ://www.slideshare.net/gaetanlion/economic-theory-testing-presentation

请注意,这种方法并不完美。它只是确认某些事件发生在其他事件之前,并且这些事件似乎具有一致的方向关系。这似乎需要真正的因果关系,但并非总是如此。公鸡的晨叫不会导致太阳升起。