数据挖掘 - 协方差作为内积 - 吾爱随笔录 - 问答

协方差作为内积

数据挖掘统计数据数据分析

2021-09-30 21:07:13

如果一个向量没有投影到另一个向量上，为什么将协方差视为内积？

现在我认为这只是乘以 $x$ 向量段（ $x_i - \bar{x}$ ）和 $y$ 分割（ $y_i - \bar{y}$ ) 的同一向量，以了解关系的方向。

1个回答

定义

可以在两个向量上定义内积（AKA 点积和标量积） $\mathbf{x}$ 和 $\mathbf{y}$ $\in \mathcal{R^n}$ 作为

x . x^{T} =< x, y >_{R^{n}} =< y, x >_{R^{n}} = \sum_{i = 1}^{n} x_{i} \times y_{i}

$\mathbf{x.x^T} = <\mathbf{x},\mathbf{y}>_\mathcal{R^n}=<\mathbf{y},\mathbf{x}>_\mathcal{R^n} = \sum_{i=1}^{n} x_i \times y_i$

内积可以看作是一个向量到另一个向量的投影长度，它被广泛用作两个向量之间的相似性度量。

内积还具有以下性质：

可交换或对称
分布式（通过向量加法）
双线性
正定：即 $\mathbf{x.x^T} > 0,\forall \mathbf{x}$

两个随机变量的协方差 $X$ 和 $Y$ 可以定义为

E [(X - E [X]) \times (Y - E [Y])]

$E[(X-E[X]) \times (Y - E[Y])]$

协方差具有可交换、双线性和正定的性质。

这些属性意味着协方差是向量空间中的内积，更具体地说是商空间。

与内核技巧的关联

如果您熟悉支持向量机，您可能熟悉内核技巧，您可以将两个向量的内积隐式计算到映射空间中，称为特征空间。如果没有执行映射，您可以将内积计算到甚至可能是无限维空间中，因为有了这个映射。

要执行该内积，您需要找到一个称为核函数的函数，该函数可以执行该内积，而无需显式映射向量。

要使核函数存在，它需要具有以下属性：

它必须是对称的
它必须是正定的

这对于一个功能来说是充分和必要的 $\kappa(\mathbf{x,y})$ 被认为是任意向量空间中的内积 $\mathcal{H}$ .

作为协方差，遵守这个定义，它是一个核函数，因此它是向量空间中的一个内积。

其它你可能感兴趣的问题

上一篇SVM 中的“内核”和卷积神经网络中的“内核”之间是否存在概念上的关系？下一篇缩放神经网络