协方差与联合分布的关系

机器算法验证 自习 相关性 数理统计 独立 系词
2022-04-12 12:50:38

这是概率论中一个极其基础的问题。即,对于任何两个变量,如果 不为 0(在总体中),这意味着它们的联合分布是什么?换句话说,变量的联合分布与它们的协方差有何关系?xycov(x,y)

1个回答

我会问相反的问题:零协方差对任何幸存的依赖有何影响?这两个变量当然可以随机依赖,即使它们的协方差为零,但是如果协方差为零,则排除了什么样的依赖关系,以及什么样的双变量联合分布?

一些例子:

a)多对多“命名”双变量连续联合分布(即两个边缘属于同一族的联合分布)。

b) Farlie-Gumbel-Morgenstern 族的二元连续分布

HX,Y(x,y)=FX(x)GY(y)(1+α(1FX(x))(1FY(y))),α<1

的两个随机变量这里对于零协方差和随机独立性是必要且充分的。所以在这里你不能没有另一个。FX(x)Gy(y)α=0

c)最后必须记住,尽管协方差通常被描述为“反映两个变量之间的“线性”依赖关系”,但这可能会产生误导,因为当随机变量是另一个的纯非线性函数时,几乎总是它们的协方差将非零。考虑一个非常简单的情况,让XY

X=Y2Cov(X,Y)=E(XY)E(X)E(Y)=E(Y3)E(Y2)E(Y)

这通常不会为零。

等等。当然,确实存在用零协方差建模随机依赖的无限方法,但上面表明,如果一个人想这样做,“现成的”二元分布不会这样做,纯粹的假设也不会。非线性关系。

这就是为什么 Copulas 可能是要走的路,正如评论所建议的那样,因为从这个角度来看,它们允许我们以系统的方式对任何边际分布的依赖关系进行建模。这很重要,因为在查看数据时,我们可以更轻松地分别描述每个数据系列的分布,并且在这里调用我们著名和研究过的边际分布族的股票很方便(并且每个变量可能看起来都有属于不同家族的边缘人)。它们的联合分布可能是非标准的,因此尚未研究。然后我们看 Copulas 来描述依赖关系。