教学实例:相关不等于因果

机器算法验证 相关性 教学
2022-01-29 23:26:45

古语有云:“相关不等于因果”。在教学时,我倾向于使用以下标准示例来说明这一点:

  1. 丹麦鹳的数量和出生率;
  2. 美国的牧师人数和酗酒;
  3. 在 20 世纪初,人们注意到“收音机的数量”和“疯人院的人数”之间存在很强的相关性
  4. 还有我最喜欢的:海盗导致全球变暖

但是,我没有这些示例的任何参考资料,虽然很有趣,但它们显然是错误的。

有人有其他好的例子吗?

4个回答

解释“原因”是一种不对称关系(X 导致 Y 不同于 Y 导致 X)可能很有用,而“相关”是一种对称关系。

例如,无家可归人口和犯罪率可能是相关的,因为两者在同一地点往往高或低。说无家可归人口与犯罪率相关,或者犯罪率与无家可归人口相关,这同样有效。说犯罪导致无家可归,或无家可归人口导致犯罪是不同的说法。相关性并不意味着两者都是正确的。例如,根本原因可能是第三个变量,例如药物滥用或失业。

统计学的数学并不擅长识别根本原因,这需要一些其他形式的判断。

我最喜爱的:

1) 越多的消防员被派往火灾,造成的损失就越大。

2) 接受辅导的孩子比没有接受辅导的孩子成绩差

和(这是我最喜欢的)

3)在小学早期,星座与智商相关,但这种相关性随着年龄的增长而减弱,到成年后消失。

我一直很喜欢这个:

柠檬与死亡

来源: http: //pubs.acs.org/doi/abs/10.1021/ci700332k

  1. 有时相关性就足够了。例如,在汽车保险中,男性司机与更多事故相关,因此保险公司向他们收取更多费用。你无法真正测试这个因果关系。你不能通过实验改变司机的性别。谷歌在不关心因果关系的情况下赚了数千亿美元。

  2. 要找到因果关系,您通常需要实验数据,而不是观察数据。尽管在经济学中,他们经常使用观察到的系统“冲击”来测试因果关系,例如如果 CEO 突然去世并且股价上涨,您可以假设因果关系。

  3. 相关性是因果关系的必要条件,但不是充分条件。显示因果关系需要反事实。