我正在为非常右偏的数据建模一个连续回归/预测问题。我一直在使用 ElasticNet 和 Huber 回归并取得了相当大的成功,最近开始使用 XGBoost 看看它是否会提供任何额外的价值。我的训练矩阵的维度是 60,000 行 x 500 列。
我发现,更简单、更易解释的 ElasticNet/Huber 回归模型通常优于我构建的任何 XGBoost 模型。我可以让 XGBoost 竞争的唯一方法是使用大量不同形式的正则化。特别是:性能最高的 XGBoost 模型的reg_alpha
/reg_lambda
参数在 [10-150] 范围内;gamma
在0.5、0.5和浅的[25, 100]
范围内,例如 3/4/5 subsample
,大约为 150 。colsample_by_tree
max_depths
n_estimators
从我在各种在线教程gamma
中收集到的信息来看,超过 10 或 20 的值似乎非常高,尽管我完全承认该声明可能非常依赖于所使用数据集的特性。
对于这个超正则化模型,从直观的角度来看,预测和特征重要性是有意义的。
我想我只是在寻找一些输入——我有这么高的正则化参数是疯了,还是我比以前认为的这些高值更合理,因为证据似乎在模型预测能力的布丁中/普遍性和重要特征?