在 PCA 中,当维数大于(甚至等于)样本数时,为什么最多会有个非零特征向量?换句话说,协方差矩阵在个维度中的秩是。
示例:您的样本是矢量化图像,尺寸为,但您只有图像。
在 PCA 中,当维数大于(甚至等于)样本数时,为什么最多会有个非零特征向量?换句话说,协方差矩阵在个维度中的秩是。
示例:您的样本是矢量化图像,尺寸为,但您只有图像。
考虑一下 PCA 的作用。简而言之,PCA(最常见的运行方式)通过以下方式创建一个新的坐标系:
(有关更多详细信息,请参阅此出色的 CV 线程:理解主成分分析、特征向量和特征值。)但是,它不仅仅以任何旧方式旋转轴。你的新(第一个主成分)面向数据的最大变化方向。第二个主成分朝向与第一个主成分正交的下一个最大变化量的方向。其余的主成分同样形成。
考虑到这一点,让我们检查@amoeba 的示例。这是一个在三维空间中有两个点的数据矩阵:
因此,让我们按照上面列出的步骤进行操作。(1) 新坐标系的原点将位于. (2) 轴已经相等。(3) 第一个主成分将从到,这是这些数据变化最大的方向。现在,第二个主成分必须与第一个主成分正交,并且应该朝着剩余变化最大的方向前进。但那是什么方向?是不是从到,或从到, 或者是其他东西? 没有剩余的变异,因此不能再有任何主成分。
和数据,我们可以拟合(最多)主要成分。
假设我们有一个矩阵, 其中每个是来自的观察(样本)维空间,所以是一个经过矩阵,和.
如果我们首先将数据集居中,我们有, 意思是:,所以列秩为, 然后.
我们知道, 所以最多有非零特征值。