我有一组 10 个实验,用于计算每个实验的精度、召回率和 f1 分数。现在,平均精度和平均召回率很容易计算。我对平均 f1 分数有些困惑。
有两种方法可以计算平均 f1 分数:
- 对 10 个实验中的每一个取 f1 分数并计算它们的平均值。
- 取平均精度和平均召回率,然后使用公式计算 f1-score
f1 = 2*p*r/(p+r)
我找不到任何强有力的参考来支持任何论点。我能找到的最接近的文件是:https ://www.kaggle.com/wiki/MeanFScore
任何人都可以通过一些参考(如果可能的话)解释哪些方法是正确的,为什么?
编辑:其中一位成员建议了这个来源。不过,我仍然怀疑消息来源的可靠性。我看到人们在他们的研究出版物中没有使用上述方法。(即使我会在我的一份出版物中使用它)我希望社区的更多意见来验证这个想法。