想象一下,我有以下矩阵,它给出了德语、哲学、数学和物理科目学生的成绩:
ger = c(2,4,1,3,2,4,4,1,2,3)
phi = c(3,4,1,2,2,3,3,2,2,2)
mat = c(1,3,2,4,1,2,2,4,3,1)
phy = c(2,2,2,5,2,2,3,4,3,3)
A = cbind(ger,phi,mat,phy)
我将所有内容组合成一个矩阵并缩放数据:
As = scale(A)
现在,我summary 在 PCA 上执行:
summary(princomp(As), loadings = TRUE)
它返回以下输出:
Importance of components:
Comp.1 Comp.2 Comp.3 Comp.4
Standard deviation 1.3257523 1.1657791 0.59600603 0.35793402
Proportion of Variance 0.4882275 0.3775114 0.09867311 0.03558799
Cumulative Proportion 0.4882275 0.8657389 0.96441201 1.00000000
Loadings:
Comp.1 Comp.2 Comp.3 Comp.4
ger 0.496 -0.502 0.519 0.482
phi 0.548 -0.443 -0.423 -0.570
mat -0.430 -0.572 -0.546 0.435
phy -0.518 -0.474 0.503 -0.503
我对第一个组件有一些提示(基于负载):
- 德语和哲学之间存在高度正相关,数学和物理之间也存在高度正相关。
- 谁擅长语言(德语和哲学)通常在 MINT(数学和物理)方面更差,反之亦然。
还有关于第二个的想法,我无法解释:
- 它是所有四个变量的加权算术平均值。
但我不知道如何解释Comp. 2,Comp. 3和Comp. 4基于负载。特别是因为 的所有值Comp. 2都是负数,或者具有相同的方向。有人能帮我吗?提前致谢!