我有一个具有 4 个特征的测试数据集,PCA 产生一组 4 个特征向量,例如,
EigenVectors: [0.7549043055910286, 0.24177972266822534, -0.6095588015369825, -0.01000612689310429]
EigenVectors: [0.0363767549959317, -0.9435613299702559, -0.3290509434298886, -0.009706951562064631]
EigenVectors: [-0.001031816289317291, 0.004364438034564146, 0.016866154627905586, -0.999847698334029]
EigenVectors: [-0.654824523403971, 0.2263084929291885, -0.7210264051508555, -0.010499173877772439]
特征向量值是否代表原始数据集中的特征?例如,特征 1 和 2 是否解释了特征向量 1 中的大部分方差?
我是否正确地解释了结果,因为 PC1 代表 90% 的方差,所以特征 1 和 2 在我的数据集中是最重要的?
我正在尝试映射回原始特征,但不确定如何解释结果。