如何在 PCA 之前赋予特征权重

数据挖掘 机器学习 主成分分析 加权数据
2021-10-13 22:46:19

我想知道如何在使用 PCA 之前赋予我的特征权重。我的意思是某种加权 PCA。因为我知道其中一个功能比其他功能更好,并且希望在创建组件时重视它(不可能只选择该功能。我也应该有其他影响)

2个回答

PCA 是用于寻找最重要组件的无监督方法。我看不出你应该增加重量的理由。如果您知道哪些功能很重要,为什么还要使用 PCA?或者对不确定重要性的特征执行 PCA。

此外,分量是在具有最高方差的方向上创建的,并且重要性通过特征值来衡量。所以我可以想象你可以以某种方式增加方差(就像 Jan van der Vegt 提出的那样)。但这是一个输出非常可疑的巫术。

标准化数据后,您可以将特征与权重相乘以在主成分分析之前分配权重。赋予更高的权重意味着特征内的方差会上升,这使得它更加重要。

标准化(均值 0 和方差 1)对于 PCA 很重要,因为它正在寻找一个新的正交基,其中原点保持不变,因此以原点为中心的数据是好的。第一个主成分是方差最大的方向,通过缩放权重大于 1 的某个特征将增加该轴上的方差,从而赋予该轴更多的权重,将第一个主成分拉向它的方向。