数据挖掘 - 为 XGBoost 处理不平衡数据的最佳方法是什么？ - 吾爱随笔录

有很多方法可以处理类不平衡数据，例如欠采样、过采样、更改成本函数等。

这是谈论它们的帖子。

我正在处理一个不平衡的多类分类问题，并尝试使用 XGBoost 算法来解决它。我想了解哪种方法在这里效果最好。由于 XGBoost 已经有一个名为 weights 的参数（它为每个火车记录赋予权重），直接使用它而不是欠采样、过采样、编写成本函数等是否明智？