我建立了一个分类模型并针对验证数据集对其进行了测试。正集由 86 个案例组成,负集由 1256 个案例组成。混淆矩阵如下
True positive True negative precision
Predict positive 55 338 13.99%
Predict negative 31 918 96.73%
Recall 63.95% 73.09%
这个分类器的精度和召回率不好,尤其是正精度。然而,负面案例远多于正面案例。我不太确定,对于这种不平衡的数据,我们还能像往常一样使用precision和recall作为性能评估吗?