我知道在回归情况下,如果您有一组高度相关的变量,这通常是“坏的”,因为估计系数的不稳定性(当行列式趋向零时,方差趋向无穷大)。
我的问题是这种“坏处”是否会在 PCA 情况下持续存在。当协方差矩阵变得奇异时,任何特定 PC 的系数/负载/权重/特征向量是否变得不稳定/任意/非唯一?我对只保留第一个主成分而所有其他成分都被视为“噪音”或“其他东西”或“不重要”的情况特别感兴趣。
我认为不会,因为您将只剩下一些零方差或接近零方差的主成分。
很容易看出,在具有 2 个变量的简单极端情况下,情况并非如此——假设它们完全相关。然后第一个 PC 将是精确的线性关系,第二个 PC 将与第一个 PC 垂直,所有观测值的所有 PC 值都为零(即零方差)。想知道它是否更一般。