据我了解,主成分是通过旋转坐标轴以将它们与最大方差的方向对齐来获得的。
尽管如此,我一直在阅读“未旋转的主成分”,我的统计软件 (SAS) 为我提供了 varimax 旋转的主成分以及未旋转的主成分。在这里我很困惑:当我们计算主成分时,轴已经旋转了;那么为什么需要另一个轮换呢?“未旋转的主成分”是什么意思?
据我了解,主成分是通过旋转坐标轴以将它们与最大方差的方向对齐来获得的。
尽管如此,我一直在阅读“未旋转的主成分”,我的统计软件 (SAS) 为我提供了 varimax 旋转的主成分以及未旋转的主成分。在这里我很困惑:当我们计算主成分时,轴已经旋转了;那么为什么需要另一个轮换呢?“未旋转的主成分”是什么意思?
这将是一个非技术性的答案。
你是对的:PCA 本质上是坐标轴的旋转,选择使得每个成功的轴尽可能多地捕获变化。
在某些学科(例如心理学)中,人们喜欢应用 PCA 来解释结果轴。即他们希望能够说主轴#1(它是原始变量的某种线性组合)具有某些特殊含义。为了猜测这个意思,他们会查看线性组合中的权重。然而,这些权重往往是杂乱无章的,无法辨别出明确的含义。
在这些情况下,人们有时会选择稍微修改一下普通的 PCA 解决方案。它们采用一定数量的主轴(根据某些标准被认为是“重要的”),并另外旋转它们,试图实现一些“简单的结构”——即更容易解释的线性组合。有一些特定的算法可以寻找最简单的结构;其中之一称为 varimax。在 varimax 旋转之后,连续的组件不再捕获尽可能多的方差!PCA 的这个特性被额外的 varimax(或任何其他)旋转破坏了。
因此,在应用 varimax 旋转之前,您有“未旋转”的主成分。之后,你会得到“旋转”的主成分。换句话说,这个术语指的是 PCA 结果的后处理,而不是PCA 旋转本身。
所有这一切都有些复杂,因为旋转的是载荷而不是主轴。但是,对于数学细节,我在这里向您(以及任何感兴趣的读者)推荐我的长答案:PCA 后跟旋转(例如 varimax)是否仍然是 PCA?