面试问题:如果相关性不代表因果关系,你如何发现因果关系?

机器算法验证 自习 相关性 因果关系
2022-02-10 05:50:35

我得到了这个问题:

如果相关性并不意味着因果关系,你如何发现因果关系?

在一次采访中。

我的回答是:你做某种形式的 A/B 测试。面试官不断催促我换一种方法,但我想不出任何方法,他也不会告诉我我最初的反应是否正确。

还有其他方法吗?我的回答正确吗?

4个回答

有几种方法可以解决这个问题。你说得对,A/B 测试就是其中之一。今年的诺贝尔经济学奖是因为在研究反贫困政策方面的开创性实地实验而获得的。

否则,您可以使用以下替代方法之一:

  1. 可观察物的选择。可能是最流行的方法。您假设以某些控制变量为条件,治疗分配是随机的。在所谓的潜在结果框架中,在二元处理下,您可以将此假设声明为 where ,是单位在治疗状态下的结果,特征的向量。实现这一点的理想方法是随机化Yi(1),Yi(0)TiXiTi{0,1}Yi(t)itXiiTi. 但其他依赖此假设的方法是匹配(包括 ML 方法,如因果树)、逆概率加权,以及在线性回归计算机科学为我们提供了用于因果推理的“有向无环图”理论,它帮助我们思考要包含在中哪些是好的变量,哪些是坏的变量。XiXi
  2. 回归不连续设计。这种方法非常流行,因为它提供了将结果作为因果的可信解释。为了说明这个想法,以空间不连续性为例。假设发生地震,某个地区的孩子被要求 3 个月不上学。边境外的孩子上学没有受到干扰。因此,您可以将区域内的孩子与区域外的孩子进行比较,并且似乎唯一不同的是他们之间的上学率。然后,您可以回归他们随后的受教育年限、大学出勤率等,他们居住在边界的哪一侧,并获得出勤率的因果效应。请注意,如何围绕不连续性选择正确的窗口并实施 RD 估计器是一个微妙的问题,这背后有文献(请参阅@olooney 对此答案的评论)。
  3. 工具变量。这类似于回归不连续性,但通常更难防御。工具是您认为仅通过治疗状态(即通过您要测量其影响的变量)与结果相关的变量。如果是这种情况,您可以使用称为两阶段最小二乘法的方法来估计因果效应。这个类型有一个小型图书馆的研究价值,如果假设失败,事情会如何出错,即使他们没有失败。但请注意,RD 可以是有效的工具。在地震的例子中,某人居住在边界的哪一边可以作为上学的工具,因为它似乎与解释结果的任何其他因素无关。此类别中的其他巧妙策略是轮班份额和 Bartik 工具。这些也有研究探索他们所依赖的假设。
  4. 差异中的差异。这种方法放宽了对可观察对象的选择假设。它移动到前后设置,并将治疗组的平均结果变化与对照组的平均结果变化进行比较。在这样做时,它做出的假设是平行趋势的假设:如果他们没有接受治疗,治疗组的平均变化将与对照组的平均变化相同。这种方法非常受欢迎,因为它比对可观察对象的选择更健壮,并且可以可靠地应用它的设置比回归不连续性或工具变量更普遍。一个著名的例子是 Card 和 Krueger 的最低工资研究,他们比较了费城地区的快餐店工人在最低工资变化前后的比较。这种方法的一个相对较新的变体是合成控制,它构建一个人工控制组并进行 diff-in-diff,您可能喜欢也可能不喜欢它的可信度。

我想给你一个哲学和科学的答案:

在理论上和原则上,因果关系是无法观察到的。它从来没有,也永远不会。举个简单的例子:当你在这个网站上输入帖子时,当你按下键盘上的按钮并且屏幕上出现字母时,你就假设了一个因果关系。首先,因为您观察到击键和屏幕上出现的字母之间的相关性。其次,因为你有一个关于你脑海中正在发生的事情的因果关系模型,你认为它是合理的(这基本上是键盘是用于打字的输入设备)。

但是,两者都不是因果关系,您无法观察因果关系。可能是每次您按键时,一个隐形恶魔都会在您的屏幕上创建字母。这就是哲学的观点和答案。

科学的答案是观察因果关系:您需要操纵输入数据,控制其他一切并观察结果。由于您不是设计研究的心理学家,而是分析数据,这意味着您需要随着时间的推移获得数据。

因此,例如,如果您的假设是生活在人口稠密的城市会增加患临床抑郁症的风险:那么您将需要一个生活在大城市的人的样本,这些人后来患上了临床抑郁症。并且不仅仅是变量“确实住在大城市”和“患有临床抑郁症”之间的正相关。您还需要控制其他自变量。

实现这一点的另一种方法是在实验室环境中,您可以明确地操纵变量(并且更容易控制其他自变量)。然而,这种方法与数据科学并没有太大关系。

简要地...

选项1:

随机对照试验。“黄金标准”。

选项 2:

  1. 画出你的系统的因果图。您和其他人认为系统如何运行的有向无环图。
  2. 决定是否可以通过后门标准、前门标准或其他条件独立方法从观察性研究中推断出因果关系。收集有关变量的数据。犹大珍珠
  3. 使用 1 和 2 建立统计模型。
  4. 小心谨慎,因为您的 DAG、统计模型和数据都不完美。

有关温和的介绍,请参阅 Pearl 的The Book of Why

不确定这会增加什么,但是如果您需要哲学的另一种想法,那么早在 1960 年代,我们在哲学课上就被教导休谟的 3 个因果关系标准:(1)时间优先(假定的原因在时间之前) ; (2) 可观察到的经验相关性;(3) 排除了所有对立的假设。

假设标准#3实际上是不可能的,那么将永远无法证明因果关系。