机器算法验证 - PCA 的线性度 - 吾爱随笔录

PCA 的线性度

机器算法验证主成分分析线性的

2022-02-09 18:38:02

PCA 被认为是一个线性过程，但是：

P C A (X) \neq P C A (X_{1}) + P C A (X_{2}) + \dots + P C A (X_{n}),

$\mathrm{PCA}(X)\neq \mathrm{PCA}(X_1)+\mathrm{PCA}(X_2)+\ldots+\mathrm{PCA}(X_n),$

其中。这就是说，PCA 在数据矩阵 X_i 上获得的特征向量之和不等于 PCA 在数据矩阵之和上获得的特征。的定义不就是： $X=X_1+X_2+\ldots+X_n$ $X_i$ $X_i$ $f$

f (x + y) = f (x) + f (y) ?

$f(x+y)=f(x)+f(y)?$

那么，如果 PCA 不满足这个非常基本的线性条件，为什么它会被认为是“线性的”呢？

3个回答

当我们说 PCA 是一种线性方法时，我们指的是从高维空间到低维空间。在 PCA 中，这个映射是由与 PCA 特征向量矩阵相乘得到的，因此显然是线性的（矩阵乘法是线性的）：这与降维的非线性方法形成对比，其中降维映射可以是非线性的。 $f:\mathbf x\mapsto \mathbf z$ $\mathbb R^p$ $\mathbb R^k$ $\mathbf x$

z = f (x) = V^{⊤} x .

$\mathbf z = f(\mathbf x) = \mathbf V^\top \mathbf x.$

另一方面，前个特征向量是从数据矩阵使用你所说的在你的问题中：而且这个映射肯定是非线性的：它涉及计算协方差矩阵的特征向量，这是一个非线性过程. （作为一个简单的例子，将乘以会使协方差矩阵增加，但其特征向量保持不变，因为它们被归一化为具有单位长度。） $k$ $\mathbf V\in \mathbb R^{p\times k}$ $\mathbf X\in \mathbb R^{n\times p}$ $\mathrm{PCA}()$

V = P C A (X),

$\mathbf V = \mathrm{PCA}(\mathbf X),$

X

$\mathbf X$

2

$2$

4

$4$

“线性”可以表示很多东西，并且不仅仅以正式的方式使用。

PCA 通常不被定义为正式意义上的函数，因此当这样描述时，预计它不会满足线性函数的要求。正如您所说，它更经常被描述为一个过程，有时是一个算法（尽管我不喜欢最后一个选项）。它通常以一种非正式的、没有明确定义的方式被称为是线性的。

例如，在以下意义上，PCA 可以被认为是线性的。它属于一系列方法，这些方法认为每个变量都可以通过函数来近似，其中和是一组变量，具有一些期望财产。在 PCA 的情况下，是一组自变量，可以减少基数，而在特定意义上的近似精度损失最小。这些是许多环境中理想的属性。 $X_i$

X_{i} \approx f_{Y} (α)

$X_i \approx f_Y(\alpha)$

α \in R^{k}

$\alpha \in \mathbb{R}^k$

Y

$Y$

k

$k$

Y

$Y$

现在，对于 PCA，每个都被限制为中变量的线性组合。 $f_i$

f_{Y} (α) = \sum_{i = 1}^{k} α_{i} Y_{i}

$f_Y(\alpha) = \sum_{i=1}^k \alpha_{i}Y_i$

Y

$Y$

和的最佳（在某种意义上）值。也就是说，PCA 仅将线性函数视为似是而非的假设。从这个意义上说，我认为它可以被合理地描述为“线性”。 $Y$ $\alpha_{ij}$

PCA 提供/是一种线性变换。

如果你使用与特定分析相关的映射，比如那么。 $\mathbf{M} \equiv PCA(X_1 + X_2)$ $\mathbf{M}(X_1+X_2) = \mathbf{M}(X_1) + \mathbf{M}(X_2)$

罪魁祸首是、和不是相同的线性变换。 $PCA(X_1 + X_2)$ $PCA(X_1)$ $PCA(X_2)$

作为比较，一个使用线性变换但本身不是线性变换的过程的非常简单示例：

旋转将向量（比如二维欧几里得空间中的一个点）与某个参考向量（比如 )，不是线性变换。例如 $D(\mathbf{v})$ $\mathbf{v}$ $\left[x,y\right]=\left[1,0\right]$

$D(\left[1,1\right]) \rightarrow \left[0,\sqrt{2}\right]$

和

$D(\left[0,1\right]) \rightarrow \left[-1,0\right]$

但

$D(\left[1,1\right]+\left[0,1\right]=\left[1,2\right]) \rightarrow \left[-0.78,2.09\right] \neq \left[-1,\sqrt{2}\right]$

这种角度的加倍，涉及角度的计算，不是线性的，类似于变形虫的说法，即特征向量的计算不是线性的

其它你可能感兴趣的问题

上一篇在 Tensorflow 中构建自动编码器以超越 PCA 下一篇如何解决辛普森悖论？