主成分分析定义

信息处理 转换 主成分分析
2022-01-27 09:16:33

这个方法我刚刚学过,所以不是很熟悉。据我所知,主成分分析(又称 PCA)用于将属于转换为属于,其中新向量由 p 个不相关的分量组成。我也知道这些分量保持初始向量的最大可能能量。最后但同样重要的是,由于 PCA 是正交变换,它应该最小化误差范数(初始向量与其投影之间的差异)。如果我错了,请纠正我。xdyppdypx

所以假设我们有一个随机向量属于空间并且我们使用 PCA 将其投影到我提出了三个说法。但是,我无法找出哪个是正确的:xRdppd

  1. PCA 将向量投影到维空间,其中投影具有最小能量xp
  2. PCA 将向量维空间,其中初始向量和投影之间的差异具有最大能量。xp
  3. PCA 将向量同胚的空间xRp

那么哪个是正确的说法?

1个回答

通过使用 PCA(在 PC 上)投影向量 x,您可以在缩减空间中最大化方差。最初,空间在最大化方差方面并不是最优的。

所以:

PCA 将向量 𝑥 投影到 𝑝 维空间,其中初始向量和投影之间的差异具有最大能量。

(最初没有最大方差,但在投影后空间在最大化 PC 定义空间中的方差方面是最佳的)

PS:

最小化 J1(误差)对应于最大化二次形式 e'Se。贬低后这是e'X'Xe。现在设置 w = Xe(数据 X 的投影)。投影空间的方差是 w'w,等于 e'X'Xe。因此,最小化误差意味着最大化方差