相关与因果混淆的真实例子

机器算法验证 相关性 因果关系
2022-01-21 22:24:02

我正在寻找从相关证据中不恰当地推断出因果关系的具体真实案例。

具体来说,我对满足以下条件的示例感兴趣:

  • 因果关系的存在被广泛接受为足以产生显着影响的事实(对公共政策、话语、个人决策等)。
  • 这种联系仅根据相关证据推断出来(可能与存在连贯但未经证实的因果机制一起存在)。
  • 因果关系在客观上被证伪了,或者至少引起了严重怀疑。

我想到的两个例子并不理想:

  1. 钠摄入量和血压:据我了解,已经确定盐摄入量只会增加钠敏感个体的血压。有效因果关系的存在(尽管不完全是最初被接受的因果关系)使这个例子不那么引人注目。
  2. 疫苗和自闭症:我的背景可能有误,但我相信这种联系是根据相关性和(欺诈性)实验证据推测出来的。存在(假)直接证据这一事实削弱了这个例子。

注意:我见过这个类似的问题:

教学实例:相关不等于因果

我的问题主要不同之处在于它侧重于值得注意的现实世界的例子,而不是明显不存在因果关系的例子(例如,体重和音乐技巧)。

3个回答

多年来,研究人员使用Bradford Hill 式启发式标准推断因果关系的大型观察性流行病学研究断言,有证据表明女性激素替代疗法 (HRT) 降低了冠心病的风险,而且只有在两项大规模随机试验证明相反,关于 HRT 的临床理解和临床建议发生了变化。这是当代流行病学中的经典警示故事,您可以在教科书(例如,Leon Gordis 的流行病学)以及有关David Hume 经典格言的维基百科文章中阅读。

也就是说,布拉德福德山标准已经有一段时间没有被理解为最先进的标准了,反事实因果推理 朱迪亚珍珠杰米罗宾斯桑德格陵兰等)是真正的重担。可以在不进行随机实验的情况下做出合理强的因果推断,例如使用工具变量孟德尔随机化等(这对科学有好处,因为我们无法对宇宙的大部分(如果不是大多数)进行随机实验) )。

不是最迷人的话题,但Nora T. Gedgaudas(第 18 章)很好地总结了关于纤维在预防结肠癌中的作用的研究结果的转变。纤维,25 年来被广泛认为是一个重要的预防因素(基于相关性),通过 16 年、88,000 名受试者的护士研究表明,它仅仅是其他重要因素的相关性。其中包括食用富含某些营养素的水果和蔬菜(降低风险)和红肉,尤其是加工过的红肉(增加风险)。作者指出,即使在医生中,这个神话“似乎仍然顽固地存在”。正如经常发生的那样,一旦一个模式的消息传出去,就很难根除这个想法。

糙皮病

根据本书的章节糙皮病是一种以头晕、嗜睡、流疮、呕吐和严重腹泻为特征的疾病,到 1900 年代初在美国南部已达到流行程度,被广泛归因于一种未知病原体,基于与不卫生的生活条件相关。Joseph Goldberger 博士通过实验证明,这种疾病实际上是由不良饮食引起的,这种不良饮食(以及不卫生的生活条件)源于战后南方的普遍贫困。他的工作在很大程度上被忽视了,直到 1930 年代后期,研究人员最终证明这种疾病是由缺乏烟酸引起的。

视力训练

来自同一来源- 阅读(不)能力和阅读期间不稳定的眼球运动之间的相关性被认为是错误方向的因果关系的证据,并且实施了“眼球运动训练计划”以提高识字率。这些都是无效的,后来的工作表明因果关系是相反的;阅读困难会导致在不良读者中观察到的回归和固定。