我有一个包含 11 个特征的数据集,我注意到操纵这些特征(例如删除其中一个或一些特征)不会影响训练和测试数据的错误分数,因此我必须检查这些特征的重要性。以下是:

正如所注意到的,第一个特征具有非常高的贡献。然而,其余的都无关紧要。因此,我尝试仅使用第一个功能来运行模型。预计结果分数不会显着下降,因为其余 10 个丢弃的特征的特征重要性非常低。然而,仅用第一个特征运行实验后,测试数据的绝对错误百分比从 14.13010% 显着增加至 22.96036%。为什么会这样?当我使用主导特征重要性的特征进行训练时,我预计该错误将几乎接近基本测试结果?
此外,其中一些特征是相关的(不超过 0.62 的相关性),这就是分数不能如此可靠的原因吗?如果是这样,我可以使用什么 mertic 来测试相关特征的特征重要性