将 GridSearchCV 与回归树一起使用时如何解释 mean_test_score?

数据挖掘 机器学习 决策树 网格搜索
2022-02-15 18:47:42

我正在使用 GridSearchCV 来调整回归决策树的超参数。当我这样做时,我得到 mean_test_score 但我认为它会返回平均 MSE,因为它是一个回归量。如何解释 mean_test_score?有没有办法调整 GridSearchCV 使其返回平均 MSE?

这是我的代码

tree_reg = GridSearchCV(DecisionTreeRegressor(criterion="mse"), {
    "min_samples_split":[2,3,4],
    "min_samples_leaf":[1,2,3]
}, cv=5, return_train_score=False)

tree_reg.fit(X, y)

pd.DataFrame(tree_reg.cv_results_)
>>> params                   split0_test_score  .... mean_test_score
   {"min_samples_leaf":2,        0.998782             0.9989933
    "min_samples_split":3}

   {"min_samples_leaf":2,        0.998823             0.998930
    "min_samples_split":4}
            ...

mean_test_score 是什么意思?

1个回答

默认情况下,GridSearchCV使用score其估计器的方法;请参阅文档scoring上参数的最后一段

如果没有,则使用估计器的评分方法。

并且DecisionTreeRegressor.score(实际上,所有/大多数回归量)使用 R^2。


作为对您的编辑的回应:您可以指定scoring='neg_mean_squared_error'. 但也请注意, MSE 和 R^2 之间存在线性关系,因此优化其中任何一个都是等效的。