与常数向量的归一化相关

机器算法验证 相关性 互相关
2022-03-24 09:12:00

我很困惑如何解释用常数向量执行归一化相关的结果。由于您必须除以两个向量的标准差(参考:http ://en.wikipedia.org/wiki/Cross-correlation ),如果其中一个是恒定的(比如说所有 5 的向量,它具有标准差零),那么相关性是无穷大的,但实际上相关性应该为零,对吗?这不仅仅是一个极端情况,一般来说,如果一个向量的标准偏差很小,那么与任何其他向量的相关性都非常高,这显然没有意义。谁能解释我的误解?

1个回答

成为你的两个向量,让是两个原始向量均值的常数向量。样本相关性的组成部分是:xyx¯x¯1y¯y¯1

sx,y2=(xx¯)(yy¯)sx=||xx¯||sy=||yy¯||.

之间的样本相关性 只是之间角度的余弦让这个角度为我们有:xy xx¯ yy¯θ

ρx,y=(xx¯)(yy¯)||xx¯||||yy¯||=cosθ.

由于任一向量的缩放等效地缩放协方差和标准差,这意味着相关性不受比例的影响。说低标准偏差给出高相关性是不正确的。对相关性重要的是向量之间的角度,而不是它们的长度。

的特殊情况下(即是一个常数向量)你有然后给出在这种情况下,相关性是未定义的。从几何上讲,这是因为零向量没有定义的角度。y1yyy¯=0sx,y2=0sy=0