使用条件概率区分相关性和因果关系

机器算法验证 相关性 条件概率 因果关系
2022-03-19 17:45:32

我试图使用条件概率来理解因果关系和相关性之间的区别。

据我了解,可以通过以下方式量化因果关系P(E1|E2)/P(E1). 例如,如果这个比率是>1, 然后E2增加相似度E1.

现在我尝试提出类似的解释相关性的方法,我想到了:

P((E1E2)(E1cE2c))
在哪里E1c是的补码E1. 但我想不出条件概率的相关性。仅相关性是否提供有关条件概率的信息?
感谢您的帮助。

2个回答

条件概率和因果关系

您可以根据条件概率来定义因果关系的想法是哲学中的“概率因果关系”程序,例如卡特赖特和鳗鱼。可以说,它失败了(见珍珠的论点)。一个很好的关于这个主题的介绍性读物在这里您建议的概率提升关系的几个反例在第 2.10 节中。

因此,您不太可能使用条件概率机制来完全理解或以其他方式重建相关性和因果关系之间的差异,因为它是不够的。此外还需要明确的因果关系,即非概率假设。

相关性

正如@Michael Chernick 和其他评论者所指出的,相关性与条件概率密切相关。在狭义的技术意义上,它是两个变量之间线性或至少单调关联的标准化无向度量。在更广泛的非正式意义上,正如迈克尔所描述的那样:背离了统计独立性。在任何一种意义上,它都可能是潜在因果关系的结果。或者不,例如,它实例化了上述反例之一或展示了辛普森悖论。因此,重建一个与另一个的困难/不可能。

表明E2增加的可能性E1只是另一种说法,即事件之间存在关系,因此存在非零相关性。它没有显示因果关系。没有“显示”因果关系的概率关系。相关手段P(E1E2)不相等P(E1)P(E2)可以用条件概率写成P(E1|E2)P(E1).