我的最终目标是检测高维空间中的异常(异常值)。我计划使用 PCA 来降低维度,以便能够更好地注意到此类异常。但后来我想了想,并做了一个反例,PCA 甚至可以让事情变得更糟,即使空间的维度更小。
这是一个例子。从第一张图片我们可以明显看出红点是一个异常。当我们执行 PCA 并达到 1 维时,这种现象就会消失。我预计这可能发生在不是从 2D 减少到 1D 而是从 N 减少到 M(M < N)的情况下。
我只是在寻找对此的确认和其他想法,这会有多大的问题?我猜我们可以以更少的维度为代价丢失相当多的重要信息,因为特征之间的相关性可能会丢失。
编辑:当我们投影到两个组件时也是这种情况。在这种情况下,现象被保留(如预期的那样),但我必须强调,我最初的目标是降低维度,这在这种情况下没有实现。