我正在使用xgboost
具有极端类不平衡的数据来训练模型。从这里参考后。
在执行网格搜索和一些手动设置后,我发现以下参数最适合我:
weight <- as.numeric(labels) * nrow(test) / length(labels)
upscale <- sum(weight * (labels == 1.0))
xgb_params = list(
objective = 'binary:logistic',
eta = 0.1,
max_depth = 4,
eval_metric = 'auc',
max_delta_step = 10,
scale_pos_weight = upscale
)
如何xgboost
为最佳 AUC 自动设置最佳超参数的过程?请注意,其中一些参数不受caret
实现的支持,xgboost
但对于我必须设计的模型非常重要。