虚假关系:风味、术语

机器算法验证 术语 教学 虚假相关
2022-03-30 06:05:41

当我想到“虚假”一词(如“虚假回归”或“虚假相关”)时,我会想到以下类型的关系:

  1. 特定于样本而非总体/数据生成过程 (DGP) 的统计关系。比如说,几个变量碰巧在一个特定的样本中发生了共变。
  2. 存在于有限总体中但不特定于总体背后的 DGP 的统计关系。只要我们对 DGP 的属性感兴趣,基本上与 (1) 相同。
  3. DGP 中固有的关系并具有主题解释,但从主题的角度来看,该解释是无趣的(该观点是针对特定问题的)。例如溺水人数和冰淇淋销量,两者都受气温驱动。从双方都不会导致对方的观点来看,这种关系是无趣的。
  4. DGP 中固有但没有主题解释的关系。(这甚至可能吗?)

问题:这些案例中哪些是“虚假关系”的实例?剩下的案件怎么称呼?

额外问题(以防万一您对此事有意见):在教授给管理专业学生的定量方法课程中,哪些可能最值得关注?

编辑: 4 的示例:具有独立增量的两个随机游走之间的相关性在小样本和大样本中都极有可能远离零。随机游走之间的统计关系没有主题解释(增量是相互独立生成的),但有统计解释,即具有独立增量的两个随机游走之间相关系数分布的表征.

2个回答

这些案例中哪些是“虚假关系”的实例?剩下的案件怎么称呼?

我认为 1. 和 2. 都是虚假的,但它们是由有限样本产生的。如果我们从某个分布(例如正态分布)中抽取独立样本,我们很可能会发现两者之间的相关性并不完全为零。显然,当样本量非常小时,这个问题会更糟。

3.的情况最值得关注。我可以想到可能出现这种情况的几种情况:

  • 由于混杂导致的虚假相关。您给出的示例是一个很好的示例,当两个变量具有共同(通常无法测量)的原因时会发生这种情况。

  • 由于数学耦合造成的虚假相关。这发生在两个变量链接的情况下,例如当两个变量除以第三个变量时。这通常发生在疾病率、暴露率、销售率等是通过除以人口规模而得出的。这可以在其他不相关的和独立的变量中引起很大的相关性。

  • 由于回归到均值 (RTM) 导致的虚假相关。高尔顿发现了这一点,即高父母的后代也往往很高,但比父母低,而小父母的后代也往往很小,但比父母小,但它可能发生在许多设置。RTM 发生在任何因测量误差和/或生理变化而在个体或群体内波动的变量。一个例子是在纵向研究中,在几个时间点测量一个变量,感兴趣的是一次或横断面测量的远端结果。用于分析此类数据的方法通常以诱导 RTM 的结果为条件。

  • 反转悖论。这是对诸如辛普森悖论、洛德悖论和压制之类的事物的通用术语,在分析子组或回归中包含中介的情况下。

我真的想不出任何符合 4 的描述的东西。

额外问题(以防万一您对此事有意见):在教授给管理专业学生的定量方法课程中,哪些可能最值得关注?

不出所料,我肯定会建议那些低于 3. 的人最值得关注。

正如我在相关答案中指出的那样,我的观点是,最好将“虚假”归因于从相关性到原因的不正确推断. 能够准确地谈论统计分析中变量之间的相关性(和其他非线性关联)的证据是很重要的,这通常会导致有明确的相关性证据或变量之间的其他一些统计关联的情况。当有证据表明它确实存在时,仅仅断言这种关系存在,当然不是“虚假的”。因此,将统计关联的推论本身称为“虚假”是不合适的。“虚假”是当一个人获取相关性证据,然后在不需要该步骤的情况下使用它来推断变量之间的直接因果关系。出于这个原因,我发现术语“虚假相关”对讨论有害,因为它实际上是指从实际存在的相关性到不存在的原因的虚假推断。


您列表中的项目:这些情况都没有让我觉得本质上是“虚假的”,尽管在某些情况下它们可能伴随着错误的推论。您列表中的第 1-2 项仅代表存在抽样误差的情况,因此对较小样本中的关系或数量的估计不能准确反映从中抽取样本的较大组中的真实关系或数量. 由于统计方法对可能的抽样误差水平进行了适当的测量,因此这里无需进一步说明。只要使用适当的估计量进行推论,并构建考虑抽样误差的适当的不确定性度量(例如,使用置信区间、贝叶斯后验区间等),就不会发生“虚假”。在我看来,

第 3 项指的是一种统计关联的实际关系,但只是“无趣”,因为它不反映关联变量之间的因果关系。同样,承认这种统计关联的存在本身并没有什么“虚假”,但如果一个人要推断冰淇淋销售和溺水之间的因果关系,那确实是一个虚假的推论。

第 4 项在我看来是不可能的。如果您将因果关系追溯到其哲学根源,最终它只是对它所采取的某些行动的对象的归因。(因果关系只是“应用于行动的同一性”——即,事物根据其性质而行动。)因此,任何产生“数据”的过程都在采取行动,并且该行动原则上可以追溯到过程及其组成对象的性质。(请注意,我们在这里谈论的是形而上学,而不是认识论;我们无法揭示因果链可能是有原因的。)


哪些项目要向学生解释:在我看来,从你的四个项目中基本上得出了三个原则,所有这些原则对于理解因果关系和统计关联之间的相互作用都很有价值。首先,有一个哲学问题是什么是因果关系在形而上学的层面。其次,有一个问题是什么时候可以从统计关联中正确推断出因果关系(什么时候不能)。第三,我们如何找到统计关联的证据,以及我们对统计关联的推断有多准确。在教授统计学时,这些问题中的每一个都很有价值,但第一个问题会让你更深入地了解哲学领域。如果您希望您的学生发展他们作为实验者的技能,那么他们应该花一些时间来面对这些问题,并建立一个统计关联和因果关系的综合理论。

至少,我希望参加一些统计课程的学生能够对估计统计关联的方法以及可能的抽样误差水平有合理的理解,并且我希望他们理解“相关性不是原因”的禁令”。随着时间的推移,他们应该对因果结构及其统计含义有更深入的理解,最终他们应该培养计划和理解实验结构的能力,这些实验结构旨在允许从关联推理过渡到因果关系推理。如果您的学生可以用合理连贯的因果关系哲学解释来支持这一点,那当然是可取的,但这种情况非常罕见,将其排除在统计学课程之外是情有可原的。