我想针对使用大型训练数据集的多类文本分类问题比较 2 个不同的分类器。我怀疑是否应该使用 ROC 曲线或学习曲线来比较 2 个分类器。
一方面,学习曲线对于确定训练数据集的大小很有用,因为您可以找到分类器停止学习(并且可能退化)的数据集的大小。因此,在这种情况下,最好的分类器可能是以最小的数据集大小达到最高准确度的分类器。
另一方面,ROC 曲线可让您找到在灵敏度/特异性之间进行正确权衡的点。在这种情况下,最好的分类器只是靠近左上部分的分类器,对于任何 FPR,TPR 最高。
我应该同时使用这两种评估方法吗?具有更好学习曲线的方法是否有可能具有更差的 ROC 曲线,反之亦然?