我找到了这些句子:
随机森林之前的 PCA 可能对降维有用,但可以为您的数据提供随机森林可以更好地执行的形状。
我很确定,一般来说,如果您使用 PCA 转换数据,保持原始数据的相同维度,您将使用随机森林进行更好的分类
来自本页: 随机森林分类前高维文本数据的 PCA?
就我而言,我发现这确实是真的,对于一个包含约 1M 记录和 25 个预测变量的数据库的回归问题。如果我使用 25 个 PCA 作为预测变量而不是 25 个原始预测变量,则误差会减少约 10% 。
任何人都可以帮助我理解和清楚地解释这个结果吗?