XGboost 的分层采样

数据挖掘 r xgboost
2022-02-15 18:00:28

我有一个多类分类数据集,其中目标(因)变量高度不平衡。在 R 中使用 randomForest 包时,我通常使用参数sampsize & strata来解决训练数据的不平衡问题。xgboost 包中是否也有类似的选项?

每个类中可用数据点数量的摘要。

因素 1:667
因素 2:676
因素 3:7807
因素 4:850

1个回答

在 R 中,它是交叉验证功能的一个选项:xgb.cv 请参阅此处的文档:https ://www.rdocumentation.org/packages/xgboost/versions/0.4-4/topics/xgb.cv