我正在尝试使用 xgboost。
我在 xgboost 上使用 score='roc_auc' 运行 GridSearchCV。最好的分类器得分约为 0.935(这是我从 GS 输出中读取的)。但是现在当我对相同的数据运行最佳分类器时:
roc_auc_score(Y, clf_best_xgb.predict(X))
它给了我分数〜0.878
你能告诉我这两种情况下的分数是如何评估的吗?谢谢
我正在尝试使用 xgboost。
我在 xgboost 上使用 score='roc_auc' 运行 GridSearchCV。最好的分类器得分约为 0.935(这是我从 GS 输出中读取的)。但是现在当我对相同的数据运行最佳分类器时:
roc_auc_score(Y, clf_best_xgb.predict(X))
它给了我分数〜0.878
你能告诉我这两种情况下的分数是如何评估的吗?谢谢
尝试使用predict_proba而不是predict如下。它应该给你相同的号码。
roc_auc_score(Y, clf_best_xgb.predict_proba ( X)[:,1])
当我们计算 AUC 时,大多数时候人们会使用概率而不是实际的类。