为什么相关系数是有限的依赖性度量?

机器算法验证 相关性 自相关 互相关
2022-04-07 01:07:15

引用 Kevin Murphy 在他的书“机器学习 - 概率视角”中的话,相关性是“一种非常有限的依赖度量”。他在介绍互信息的概念之前谈到了这一点。

为什么相关系数是“有限的依赖性度量”?是否有一些与其计算相关的假设?

2个回答

这在Wikipedia entry for Correlation and Dependence中有解释。相关性基本上衡量两个变量与它们之间的线性关系的接近程度。现在考虑XU(1,1)Y=X2那么如果你知道X,你就知道Y,如果你知道Y,你就知道X的符号。因此它们不是独立的。然而,一个简单的计算表明它们的相关性为 0。

一个简单的例子。上的任何对称分布,随机变量与其平方之间的相关性为零这是变量及其平方的均值: xx2R

μ=xdF(x)=0
σ2=x2dF(x)

让我们计算 Pearson 相关性:

ρ=xx2dF(x)μσ2=x3dF(x)μσ2=0μσ2=0

但是,如果我知道的一切这是一个例子,其中相关性并不能揭示两个变量之间的关系有多强。xx2