这是原始帖子。
在微平均法中,您将系统的各个真阳性、假阳性和假阴性相加,然后应用它们来获得统计数据。
棘手,但我发现这很有趣。有两种方法可以获得信息检索和分类的平均统计量。
1. 微平均法
在微平均法中,您将系统的各个真阳性、假阳性和假阴性相加,然后应用它们来获得统计数据。例如,对于一组数据,系统的
True positive (TP1) = 12
False positive (FP1) = 9
False negative (FN1) = 3
那么精度 (P1) 和召回率 (R1) 将为和57.14%=TP1TP1+FP180%=TP1TP1+FN1
对于不同的数据集,系统的
True positive (TP2) = 50
False positive (FP2) = 23
False negative (FN2) = 9
那么精度 (P2) 和召回率 (R2) 将为 68.49 和 84.75
现在,使用微平均方法的系统的平均精度和召回率为
Micro-average of precision=TP1+TP2TP1+TP2+FP1+FP2=12+5012+50+9+23=65.96
Micro-average of recall=TP1+TP2TP1+TP2+FN1+FN2=12+5012+50+3+9=83.78
微平均 F 分数将只是这两个数字的调和平均值。
2. 宏观平均法
该方法是直截了当的。只需取系统在不同集合上的准确率和召回率的平均值。例如,给定示例的系统的宏观平均精度和召回率是
Macro-average precision=P1+P22=57.14+68.492=62.82
Macro-average recall=R1+R22=80+84.752=82.25
宏观平均 F 分数将只是这两个数字的调和平均值。
当您想了解系统在数据集上的整体表现如何时,可以使用适用性宏观平均方法。你不应该对这个平均值做出任何具体的决定。
另一方面,当您的数据集大小不同时,微平均值可能是一种有用的度量。