当我训练和评估分类器或超参数调整时,我不喜欢单独查看精度和召回指标,因为这些数字取决于我将在之后设置的阈值,以减少输出概率并做出最终预测。此阈值通常默认为 0.5。但这完全取决于问题,我总是最终改变它。一旦我从之前的评估阶段选择了〜3个最佳模型,我喜欢在最后确定它的价值。有时我需要一个保守的分类器,有时需要一个更宽松的分类器。所以在开始之前,我需要一些东西来选择最好的模型,我最看重的指标是精确召回曲线下的面积。如果我必须只选择一个指标来查看它,那就是它。
为什么不更频繁地用于网格搜索/模型选择?也许我错过了一个重要的缺点?