我有一个多类分类数据集,其中目标(因)变量高度不平衡。在 R 中使用 randomForest 包时,我通常使用参数sampsize & strata
来解决训练数据的不平衡问题。xgboost 包中是否也有类似的选项?
每个类中可用数据点数量的摘要。
因素 1:667
因素 2:676
因素 3:7807
因素 4:850
我有一个多类分类数据集,其中目标(因)变量高度不平衡。在 R 中使用 randomForest 包时,我通常使用参数sampsize & strata
来解决训练数据的不平衡问题。xgboost 包中是否也有类似的选项?
每个类中可用数据点数量的摘要。
因素 1:667
因素 2:676
因素 3:7807
因素 4:850
在 R 中,它是交叉验证功能的一个选项:xgb.cv 请参阅此处的文档:https ://www.rdocumentation.org/packages/xgboost/versions/0.4-4/topics/xgb.cv