我正在计算两个变量(A 和 B)之间的相关性,这表明这些变量是高度相关的。我知道一个变量也与另一个变量 (C) 高度相关,因此我在 A 和 B 之间进行了偏相关,以控制 C。现在我得到的 A 和 B 之间的相关性比以前更高。- 我该如何解释?
偏相关解释
为了理解这一点,我总是更喜欢相关矩阵的cholesky分解。
假设三个变量 $XYZ$ 的相关矩阵R为 $$ \text{ R =} \left[ \begin{array} {rrr} 1.00& -0.29& -0.45\\ -0.29& 1.00& 0.93\\ -0.45& 0.93& 1.00 \end{array} \right] $$ 然后是cholesky-decomposition L as
那么 X 和 Y 的相关性是 $\newcommand{\corr}{\rm corr} \corr(X,Y)=x_1 y_1 + x_2 y_2 + x_3 y_3 $ 我们立即看到它 $\corr(X,Y )=-0.29 $ 因为零和单位因子。我们还立即看到相关性 $\corr(X,Z)=-0.45$ 因为零和单位辅因子。然而,Y 和 Z 之间的相关性为 $\corr(Y,Z) = -0.29 \cdot -0.45 + 0.96 \cdot 0.83$偏相关性(去除 X 后)是 X- 中没有变化的部分变量存在,所以 $\corr(Y,Z)._X = 0.96 \cdot 0.83 $。现在想象一下,价值 $0.83$ 将改为 $-0.83$。则偏相关为负,Y 和 Z 之间的相关为 $ 0.29 \cdot 0.45 - 0.96 \cdot 0.83$ and we see immediately it it because of the zeros and the unit-factor. We see also immediately the correlation again because of the zeros and the unit-cofactor. However, the correlation between Y and Z is The . Now imagine, the value would be instead. Then the partial correlation would be negative and the correlation between Y and Z were
我们看到的是,部分相关性部分独立于整体相关性(尽管在某些范围内)
@Gottfried Helms 给了你一个很好的答案。如果您正在寻找一种更直观易懂的解释,标准答案是:想象将 A 回归到 C 上,将 B 回归到 C 上,并且在这两种情况下都保存残差。控制 C 的 A 和 B 的偏相关是这两组残差之间的相关。换句话说,它对 A 和 B 的可变性部分之间的线性关联强度进行了索引,而这部分不能通过求助于 C 的可变性来解释。这可以与部分(或半部分)相关性形成对比,其中A 或 B 之一的残差与另一个完整变量相关。有关如何使用它的示例,Baron & Kenny (1986)和Kenny 的调解网页)。如果你想了解更多关于这些主题的信息,我在这里讨论,有一个不错的维基百科页面,我特别喜欢这个网页。