我有大量维度的电信数据。现在,如果我像 PCA 那样应用维度缩减,那么从结果维度说 PC1、PC2 我会失去意义或不理解它们代表什么。
除了 PCA 之外,它们是否有任何技术可以提供有关新维度的任何意义或直觉。还建议这方面是否有任何研究论文。
我有大量维度的电信数据。现在,如果我像 PCA 那样应用维度缩减,那么从结果维度说 PC1、PC2 我会失去意义或不理解它们代表什么。
除了 PCA 之外,它们是否有任何技术可以提供有关新维度的任何意义或直觉。还建议这方面是否有任何研究论文。
探索原始维度和 PCA 维度之间映射的一种方法是查看称为因子载荷的东西。这些本质上是将原始尺寸投影到 PCA 空间中。从中,您可以看到哪些原始特征与您的新尺寸对齐,或者彼此对齐。
可以在此处找到如何在 R 中生成具有因子载荷的 PCA 图的示例,以生成如下所示的图:
在这里,我们可以看到 PC1 轴与花瓣长度和宽度对齐,表明更高的 PC1 值与更长/更宽的花瓣密切相关。萼片长度也有相似的方向,所以 PC1 也捕捉到了很好的萼片长度变化。另一方面,萼片宽度与 PC1 和 PC2 相关。
为了赋予 PCA 的轴以意义,您可以研究两个新轴与所有原始轴之间的标量积(在此之前您必须对向量进行归一化)。
那些具有高标量积的轴将与新轴高度相关,反之亦然。这可以帮助您解释它们。
您还可以检查 t-SNE,这是一种基于概率分布的降维技术