我正在测试来自 sklearn 的梯度增强回归器,用于对噪声数据(货币市场)进行时间序列预测。
https://scikit-learn.org/stable/modules/generated/sklearn.ensemble.GradientBoostingRegressor.html
令人惊讶的是,梯度提升回归器在训练数据上实现了非常高的准确度——令人惊讶,因为数据非常嘈杂。但是,它在测试集上表现不佳。
这显然是过度拟合的情况,所以我想知道我可以更改哪些参数来规范梯度提升回归器。
到目前为止,我已经尝试了 max_depth,将其减少到 1(从默认值 3)。这似乎在提高验证集的准确性方面效果很好。
有谁知道我可以调整哪些其他参数以提高验证/测试集的性能?谢谢