我对使用哪种性能指标有一些疑问,ROC 曲线下的面积(TPR 作为 FPR 的函数)或精度召回曲线下的面积(精度作为召回的函数)。
我的数据是不平衡的,即负实例的数量远大于正实例。
我正在使用 weka 的输出预测,示例是:
inst#,actual,predicted,prediction
1,2:0,2:0,0.873
2,2:0,2:0,0.972
3,2:0,2:0,0.97
4,2:0,2:0,0.97
5,2:0,2:0,0.97
6,2:0,2:0,0.896
7,2:0,2:0,0.973
我正在使用 pROC 和 ROCR r 库。