我怎样才能防止这个模型学到更多(更少):)))

数据挖掘 Python 过拟合 助推
2021-09-23 20:31:53

如您所见,GradientBoostingClassifier 与更多的训练样本过拟合。这些是我的模型参数:

{'learning_rate':0.1,'loss':'deviance','max_depth':6,'max_features':0.3,'min_samples_leaf':80,'n_estimators':300}

我应该怎么做才能让我的模型更好或在 350 时停止训练?

在此处输入图像描述

1个回答

好吧,通过使您的模型更好,我想您的意思是对其执行某种正则化,以使其不会过拟合。然而,提前停止本身可以被视为一种正则化方法。

我建议更频繁地对模型的性能进行采样(比您当前正在执行的 200 个示例),如果在几次迭代后发现验证分数没有提高,请停止训练。

提前停止可以通过monitorGradientBoostingClassifier.fit()方法中的参数来实现。