Gridsearch 交叉验证可用于学习预测函数的超参数。考虑到在相同数据上学习和测试模型是一个很大的错误。当使用相同的数据进行学习和测试时,获得满分但无法预测任何有用的尚未看到的数据(即过度拟合)的机会非常高。在训练模型时,通常的做法是保留部分数据作为测试集,以防止过度拟合并衡量模型的性能。此外,请注意,最佳超参数可以通过网格搜索技术确定,并且网格搜索得出的分数不应用作衡量模型性能的标准。请参阅此页面了解更多信息
话虽如此,来自 GridSearchCV 的 best_score_ 是 best_estimator 的平均交叉验证分数。例如,在使用 5 折交叉验证的情况下,GridSearchCV 将数据分成 5 折,训练模型 5 次。每次,它都会将一个折叠放在一边,并根据剩余的 4 个折叠来训练模型。然后,它根据左侧折叠来衡量模型的性能。最后,它返回 5 个模型的性能平均值作为最终得分。
现在,让我们回答这个问题:最佳估计量是什么意思?它是搜索选择的估计量,或者是在遗漏数据上给出最高分数(或最小损失,如果指定)的估计量。GridSearchCV 的目标是找到最优的超参数。它接收一系列参数作为输入,并根据上面解释的平均分数找到最好的参数。网格搜索根据输入参数的不同组合训练不同的模型,最终返回最佳模型或最佳估计器。因此,best_score_ 是最佳估计器的平均分数。值得注意的是,在上述上下文中使用交叉验证调整超参数是帮助您防止过度拟合的方法之一。
在您的情况下,0.8923046854943018 是最佳估计器的平均分数。我们称这个分数为交叉验证分数。对于您的情况,我会选择第二种情况,因为在这种情况下没有过度拟合,并且交叉验证和测试分数几乎相同。在第一种情况下,交叉验证明显高于看不见的测试分数,并且存在过度拟合。这意味着该模型在训练数据上效果很好,但在看不见的数据上效果不佳。