我理解 PCA 背后的基本直觉:通过找到数据中方差最大的特征向量,并沿着这些特征向量(主成分)投影数据来降低数据的维度。
我不明白的是:
如何找到特征向量?标准特征向量方程由给出,其中和分别是特征值和特征向量。那么什么是矩阵 - 数据本身,或数据的协方差矩阵......或其他什么?(如果数据矩阵不是正方形,那么这个等式不成立。)
一旦在数据集上执行/训练了 PCA,是否可以应用它来降低新的未见数据的维数?为此,我认为 PCA 需要输出一个映射,并且该映射可以应用于新数据,例如以矩阵乘法的形式。
- PCA 的输出是什么?
- 如果有的话,输出是如何应用于新数据的?