偏相关的含义

机器算法验证 相关性 偏相关 调理
2022-03-17 01:39:49

来自维基百科

形式上,之间的偏相关性给定一组控制变量,写成,是残差之间的相关性,由的线性回归,分别。XYnZ={Z1,Z2,,Zn}ρXY·ZRXRYXZYZ

  1. 前面说

    偏相关测量两个随机变量之间的关联程度,去除了一组控制随机变量的影响。

    我想知道偏相关为条件的之间的相关性如何相关ρXY·ZXYZ

  2. 有一个特殊情况n=1

    事实上,一阶偏相关(即当时)只不过是相关性与可移除相关性的乘积除以可移除相关性的异化系数的乘积之间的差。Guilford (1973, pp. 344–345) 提供了异化系数及其通过相关性与联合方差的关系。n=1

    我想知道如何在数学上写下上面的内容?

1个回答

请注意,以 Z 为条件的相关性依赖于 Z 的变量而偏相关性是单个数字。ZZ

此外,偏相关是基于线性回归的残差定义的。因此,如果实际关系是非线性的,则偏相关可能获得与条件相关不同的值,即使以 Z 为条件的相关是独立于常数另一方面,是多元高斯分布,偏相关等于条件相关。ZZX,Y,X

对于恒定条件相关偏相关的示例:无论取哪个值,条件相关都是-1。然而,线性回归将是常数 0,因此残差将是值本身。因此,偏相关等于之间的相关;不等于 -1,因为如果未知,则变量显然不是完全相关的。

ZU(1,1), X=Z2+e, Y=Z2e, eN(0,1),eZ.
ZX|ZY|ZXYXYZ

显然,Baba 和 Sibuya (2005)显示了除了多元高斯分布之外的一些其他分布的偏相关和条件相关的等价性,但我没有读过这个。

您的问题 2 的答案似乎存在于 Wikipedia 文章中,即Using recursive formula下的第二个方程。