从 XGBoost 的教程中,我认为当每棵树生长时,都会扫描所有变量以选择分裂节点,并选择具有最大增益分裂的那个。所以我的问题是,如果我在数据集中添加一些噪声变量,这些噪声变量会影响变量的选择(对于每棵树的生长)吗?我的逻辑是,因为这些噪声变量根本没有给出最大增益分割,所以它们永远不会被选中,因此它们不会影响树的生长。
如果答案是肯定的,那么“变量越多对 XGBoost 越好”是真的吗?让我们不考虑培训时间。
另外,如果答案是肯定的,那么“我们不需要从模型中过滤掉不重要的变量”是真的吗?
谢谢!