我是一个有统计数据的菜鸟,我很难理解这一点:
- 众所周知,混杂因素会导致虚假关联,从而拒绝真正的零假设(即由于混杂因素 Z,我可以得出结论,X 和 Y 之间存在因果关系,而没有因果关系)
- 问题是:反之亦然吗?即混杂因素会导致无法拒绝错误的零假设吗?(即以某种方式“掩盖”一个可能存在的因果关系。)如果是,那将是一个令人信服的例子吗?
我是一个有统计数据的菜鸟,我很难理解这一点:
在现有答案之后,我想举一个具体的例子。想象一下试图弄清楚油门踏板是否会影响汽车的速度。您观察油门踏板踩下的距离和汽车在不同时间行驶的速度,但没有发现相关性,因此我们得出结论,它们之间没有因果关系。然而,我们缺少的是汽车在上坡和下坡的过程中,当汽车缓慢上坡时,经常需要加油。如果我们知道道路的坡度,我们就可以控制它并找到真正的因果关系。
这是 Frans 答案的最后一个图表的示例。
如果您尝试将油门踏板与加速而不是速度相关联,则此示例会更加清晰。汽车的总加速度为(gas pedal) - (hill slope)
. 假设您打开了巡航控制,那么巡航控制将尝试将加速度保持在零附近。因此,气体将被设置为抵消山坡的坡度,并且与加速度完全无关(这将由巡航控制尚未补偿的坡度变化主导)。