我遇到了这个不错的教程:使用 R 进行统计分析的手册。第 13 章。主成分分析:奥林匹克七项全能,关于如何用 R 语言进行 PCA。看不懂图13.3的解释:
所以我正在绘制第一个特征向量与第二个特征向量。这意味着什么?假设对应于第一个特征向量的特征值解释了数据集中 60% 的变化,第二个特征值-特征向量解释了 20% 的变化。将这些相互勾结是什么意思?
我遇到了这个不错的教程:使用 R 进行统计分析的手册。第 13 章。主成分分析:奥林匹克七项全能,关于如何用 R 语言进行 PCA。看不懂图13.3的解释:
所以我正在绘制第一个特征向量与第二个特征向量。这意味着什么?假设对应于第一个特征向量的特征值解释了数据集中 60% 的变化,第二个特征值-特征向量解释了 20% 的变化。将这些相互勾结是什么意思?
PCA 是分析给定相关矩阵结构的众多方法之一。通过构造,第一个主轴是当数据投影到一条线上(它代表维空间中的一个方向,假设您有个变量)时最大化方差(由其特征值反映)和第二个主轴是正交的,并且仍然最大化剩余的方差。这就是为什么当它被投影到平面上时,使用前两个轴应该产生更好的原始变量空间近似值(例如, dim
主成分只是原始变量的线性组合。因此,绘制个体因子得分(定义为,其中是任何主成分的载荷向量)可能有助于突出显示同质个体的群体,或者在同时考虑所有变量时解释一个人的总体得分。换句话说,这是一种相对于他在变量或其组合。在你的例子中,HSAUR 中的图 13.3 显示 Joyner-Kersee (Jy-K) 在第 1 轴上的得分很高(负),这表明他在所有事件中的总体表现都非常好。同样的推理也适用于解释第二个轴。我只看了一下这个图,所以我不会详细说明,我的解释肯定是肤浅的。我假设您会在 HSAUR 教科书中找到更多信息。值得注意的是,变量和个体都显示在同一张图上(这称为双图),这有助于在查看个人位置时解释阶乘轴。通常,我们将变量绘制成一个所谓的相关圆(其中任何两个变量形成的角度,这里表示为向量,反映了它们实际的成对相关性,因为向量对之间角度的余弦等于两个变量之间的相关性。变量。
但是,我认为您最好开始阅读一些关于多元分析的介绍性书籍,以深入了解基于 PCA 的方法。例如,BS Everitt 写了一本关于这个主题的优秀教科书,An R and S-Plus ® Companion to Multivariate Analysis,您可以查看配套网站以获取说明。还有其他用于应用多变量数据分析的出色 R 包,例如ade4和FactoMineR。
情节显示:
左轴和下轴显示 [归一化] 主成分分数;顶部和右侧的轴显示负载。
一般来说,它假设两个分量解释了足够量的方差,以提供案例和变量结构的有意义的视觉表示。
您可以查看空间中哪些事件紧密相连。在这种情况下,这可能表明擅长一项赛事的运动员也可能擅长其他近端赛事。或者,您可以使用该图查看哪些事件是遥远的。例如,标枪似乎有点离群,并且是定义第二个主要成分的重大事件。也许另一种运动员擅长标枪,而不是擅长大多数其他项目。
当然,关于实质性解释可以说得更多。