为什么协方差有用?

机器算法验证 相关性 协方差
2022-04-01 16:22:56

该站点上有许多与协方差相关的主题。我难以理解:为什么协方差是一个有用的计算方法?

据我所知,协方差不是一个有用的统计数据。它很难解释,而且根本没有标准化(如相关性)。它可以用完全不同的测量系统对两个变量进行计算。

有没有人有一个例子可以帮助阐明计算协方差的必要性?它只是一种达到计算回归参数的手段吗?

3个回答

协方差矩阵比相关矩阵包含更多信息:

  • 您可以从协方差矩阵导出相关矩阵。
  • 但是您不能仅使用相关矩阵推导出协方差矩阵!(您还需要标准偏差。)

协方差矩阵包含以下所有信息:(i) 相关矩阵加上 (ii) 标准差向量。在某种意义上,协方差矩阵是更紧凑、在数学上更方便使用的对象。

另一个使用协方差的例子:

我将举一个明显不涉及回归的简单财务示例:

  • 假设有可能的投资资产。n
  • 资产的协方差矩阵。Σn
  • 为表示资产的投资组合权重的向量。wn

然后投资组合方差由矩阵方程给出:

wΣw

您不能使用相关矩阵简洁地编写此公式。

最小化方差的投资组合将是以下问题的解决方案:

minimize (over wwΣw subject to: w1=1

请注意,这与最小化投资组合收益的标准差相同。

对于涉及两个或多个随机变量的任何问题,协方差是一个相当普遍的概念。它无处不最好开始习惯吧!

这完全取决于您在描述线性回归时如何编写相关参数。

对于随机变量 ,根据 的最佳(在线性最小均方误差的意义上)估计通常写为 然后声称的分数,已被 “解释” 。所有这一切都会让你大发雷霆,并宣称协方差是一个完全无用的概念。但是有些人(不是很多)喜欢把写成XYYX

(1)Y^=ρσYσX(XμX)+μY
ρ2σY2X(1)

(2)(Y^μY)=cov(Y,X)var(X)(XμX)

并说估计 与其均值的偏差和的 方差具有相同的比率,而解释的方差只是您是否愿意听取他们的论点,即协方差是更基本的概念,而相关系数只是一些没什么兴趣的 gobbledygook?为什么,如果它的名字是 Pearson 或 Spearman,它甚至都无法下定决心!Y^XXYXcov2(Y,X)var(X)

我有同样的问题。似乎协方差的值本身是没有意义的。您可以通过协方差本身唯一知道的是,协方差是一个正数,表示群体表现出相似的行为,而协方差是一个负数,表示群体表现出相反的行为。

但是,协方差的值是其他计算的必要组成部分。在金融中,(股票和市场的)协方差/市场方差 = Beta 值。这是一件有用的事情。

因此,协方差的大小本身是没有意义的,但与其他事物结合起来,它提供了意义。