为什么相关矩阵是对称的?

数据挖掘 数据集 可视化 数据 相关性
2021-09-30 19:35:01

我很抱歉数学这么弱。(我是学生)例如。这是一个相关矩阵。

          Q1        Q2        Q3
Q1  1.000000  0.707568  0.014746
Q2  0.707568  1.000000 -0.039130
Q3  0.014746 -0.039130  1.000000

为什么是对称的?为什么 Q1:Q2 与 Q2:Q1 相同?它们不应该是彼此的倒数吗?我如何阅读并理解这种关系?

3个回答

直观地说,相关矩阵是对称的,因为每个变量对都必须具有相同的关系(相关性),无论它们的相关性是在右上三角还是左下三角。说变量之间的相关性是没有意义的X1X2ρ, 但之间的相关性 X2X1ρρ 如果计算 Pearson 相关性(因此相关性是对称的)。

在数学上,两个变量之间的相关性, XY, 是可交换的: Corr(X,Y)=Corr(Y,X).

在 OP 的情况下,Q1 和 Q2 之间的相关性是相同的计算,因此与 Q2 和 Q1 之间的相关性是相同的结果。因此相关矩阵将是对称的。

有更多的数学原因和证明,为什么实值变量的相关矩阵必须是对称的和半正定的,但我已将它们排除在此答案之外。

相关矩阵是线性度的度量。它没有表达两个变量如何相互依赖。如果关系近似线性,则相关性的绝对值将更接近于 1。如果不存在线性关系,则该值为零。

考虑两组变量 (x1,y1) 和 (x2,y2)。

y1 = 2 * x1

y2 = 1000 * x2

在这两种情况下,相关性都是 1。

仅看相关矩阵无法理解 x1 和 y1 之间的确切关系。

相关矩阵是对称的,因为它表示变量之间的相关性,而相关性是一种对称关系

什么是相关矩阵?更正式一点,对于一组n 随机变量 X1,,Xn 相关矩阵包含在适当的位置 (i,j) 之间的相关值 XiXj.

表示为 corr(Xi, Xj) 变量之间的相关性 XiXj. 从相关性是对称关系的事实来看,我们对每个i,j

corr(Xi,Xj)=corr(Xj,Xi)

那就是 (i,j) 相关矩阵的项等于 (j,i) 项,这正是使矩阵对称的原因。