在多标签或多类分类设置中,在微观或加权 F1 分数之间进行选择时,我应该考虑什么?
选择宏的主要好处是人们对小班有一种有效的感觉。假设小班不重要,如何在微分或加权 F1 分数之间进行选择?
在多标签或多类分类设置中,在微观或加权 F1 分数之间进行选择时,我应该考虑什么?
选择宏的主要好处是人们对小班有一种有效的感觉。假设小班不重要,如何在微分或加权 F1 分数之间进行选择?
Micro f1 基于全局精度和召回率。它平等地对待每个测试用例,并且不给小类带来优势。我觉得更合适。
安特卫普大学 Vincent Van Asch 的这篇文章“宏观和微观平均评估措施”解释了许多不同类型的 f1 分数。