有人可以说明如何存在依赖性和零协方差吗?

机器算法验证 随机变量 协方差 独立
2022-01-29 07:33:14

有人可以像 Greg 那样,但更详细地说明随机变量如何相互依赖,但协方差为零?Greg,这里的海报,在这里举了一个使用圆圈的例子

有人可以使用一系列步骤来更详细地解释这个过程,这些步骤说明了几个阶段的过程吗?

另外,如果您知道心理学中的一个例子,请用一个相关的例子来说明这个概念。请在您的解释中非常准确和有序,并说明可能产生的一些后果。

4个回答

这里的基本思想是协方差仅测量一种特定类型的依赖,因此两者不等价。具体来说,

  • 协方差是衡量两个变量的线性相关程度。如果两个变量是非线性相关的,这将不会反映在协方差中。更详细的描述可以在这里找到。

  • 随机变量之间的依赖关系是指两者之间的任何类型的关系,这些关系导致它们“一起”行动与“自己”行动不同。具体来说,随机变量之间的相关性包含了两者之间的任何关系,这些关系导致它们的联合分布不是它们的边际分布的乘积。这包括线性关系以及许多其他关系。

  • 如果两个变量是非线性相关的,那么它们可能具有 0 协方差但仍然相互依赖 -这里给出了许多示例,下面来自维基百科的图表在底行中给出了一些图形示例:

    在此处输入图像描述

  • 随机变量之间的零协方差和独立性是等效条件的一个示例是当变量是联合正态分布时(即,两个变量遵循二元正态分布,这不等于两个变量单独正态分布)。另一个特殊情况是伯努利变量对是不相关的当且仅当它们是独立的(感谢@cardinal)。但是,一般来说,这两者不能被认为是等价的。

因此,一般来说,不能仅仅因为两个变量看起来不相关(例如没有拒绝不相关的零假设)就得出结论说它们是独立的。最好绘制数据以推断两者是否相关,而不仅仅是停止相关性测试。例如,(感谢@gung),如果要运行线性回归(即测试非零相关性)并发现不显着的结果,可能会得出结论认为变​​量不相关,但你'我只研究了线性关系。

我对心理学知之甚少,但那里的变量之间可能存在非线性关系是有道理的。举个玩具例子,认知能力似乎可能与年龄呈非线性关系——非常年轻和非常年长的人不如 30 岁的人敏锐。如果要绘制某种认知能力与年龄的关系,人们可能会期望看到认知能力在中等年龄时最高,并在此附近衰减,这将是一种非线性模式。

教学/可视化相关性或协方差的标准方法是绘制数据,在“x”和“y”的平均值处画线,然后从 2 个均值点到各个数据点绘制矩形,如下所示:

在此处输入图像描述

右上角和左下象限(示例中为红色)中的矩形(点)对相关/协方差贡献正值,而左上角和右下象限(示例中为蓝色)中的矩形(点)贡献负值相关/协方差的值。如果红色矩形的总面积等于蓝色矩形的总面积,则正负相抵消,协方差为零。如果红色区域更多,则协方差为正,如果蓝色区域更多,则协方差为负。

现在让我们看看前面讨论的一个例子:

在此处输入图像描述

各个点都遵循抛物线,因此它们是相关的,如果您知道“x”,那么您就可以准确地知道“y”,但是您还可以看到,对于每个红色矩形都有一个匹配的蓝色矩形,因此最终的协方差将为 0 .

一个简单的测试,如果数据基本上遵循通过均值围绕垂直或水平轴对称的模式,则协方差将非常接近于零。例如,如果对称性围绕 y 轴,这意味着对于具有给定 y 的每个值,与均值 x 存在正 x 差,与均值 x 存在负差。这些值的 y*x 相加将为零。您可以在其他答案的示例图集合中很好地看到这一点。还有其他模式会产生零协方差但不产生独立性,但许多示例很容易通过寻找对称与否来评估。

来自维基百科的一个例子

“如果变量是独立的,皮尔逊的相关系数为0,但反之则不成立,因为相关系数只检测两个变量之间的线性依赖关系。例如,假设随机变量X关于零对称分布,并且Y = X^ 2、那么Y完全由X决定,所以X和Y完全依赖,但是它们的相关性为零;它们是不相关的。但是,在X和Y共同正态的特殊情况下,不相关就等于独立。