有很多方法可以处理类不平衡数据,例如欠采样、过采样、更改成本函数等。
这是谈论它们的帖子。
我正在处理一个不平衡的多类分类问题,并尝试使用 XGBoost 算法来解决它。我想了解哪种方法在这里效果最好。由于 XGBoost 已经有一个名为 weights 的参数(它为每个火车记录赋予权重),直接使用它而不是欠采样、过采样、编写成本函数等是否明智?
有很多方法可以处理类不平衡数据,例如欠采样、过采样、更改成本函数等。
这是谈论它们的帖子。
我正在处理一个不平衡的多类分类问题,并尝试使用 XGBoost 算法来解决它。我想了解哪种方法在这里效果最好。由于 XGBoost 已经有一个名为 weights 的参数(它为每个火车记录赋予权重),直接使用它而不是欠采样、过采样、编写成本函数等是否明智?