这个问题是我几周前问的一个问题的延伸: 当主要目标是仅估计少数组件时,PCA 或 FA 的最小样本量?
我将重申我对在的情况下使用 PCA 感兴趣。并且通常只对将前几个 PC 轴用于描述目的或将其用作将多个维度减少为一个的“合成”变量感兴趣。
我今天的问题围绕着 Legendre & Legendre 的第三版“数值生态学”文本。在第 450 页,他们指出:
全秩离散矩阵 [variance-covariance] 不能使用小于或等于描述符数量来估计。当时,由于总共有DF,因此得到矩阵的秩为。在这种情况下,的特征分解产生实数和空特征值。在尊重它们的距离的同时定位维度。一个 PCA,其中产生大于的特征值和对应的特征向量和主成分。"
换句话说,我相信他们暗示可以在的数据集上使用 PCA ,只要您只对使用或更少的 PC 感兴趣(就像我一样)。
如果您有意见,我对您对此(他们的主张和我的解释)的意见感兴趣;并且会感谢任何可能证实这一说法的其他文献。