为 XGBoost 处理不平衡数据的最佳方法是什么?

数据挖掘 分类 r xgboost 多标签分类 阶级失衡
2021-10-08 17:10:46

有很多方法可以处理类不平衡数据,例如欠采样、过采样、更改成本函数等。

https://machinelearningmastery.com/tactics-to-combat-imbalanced-classes-in-your-machine-learning-dataset/

这是谈论它们的帖子。

我正在处理一个不平衡的多类分类问题,并尝试使用 XGBoost 算法来解决它。我想了解哪种方法在这里效果最好。由于 XGBoost 已经有一个名为 weights 的参数(它为每个火车记录赋予权重),直接使用它而不是欠采样、过采样、编写成本函数等是否明智?

1个回答