使用微 F 分数和宏 F 分数的学习曲线

数据挖掘 机器学习 评估 方差 偏见
2022-01-28 20:38:26

我使用多项朴素贝叶斯分类器的微观和宏观 F 分数绘制了学习曲线。

Micro F-score 学习曲线: 宏观 F 分数学习曲线

第一个图是使用微 F 分数制作的,第二个图是使用宏 F 分数制作的。我觉得很难解释他们两个。我发现的关于学习曲线的解释使用了错误。

我认为在第一个图中,最多有大约 300 个实例存在可变性,然后它开始收敛,直到线条平行为止。因此,即使添加更多数据也无济于事。但是偏见呢?

另外,您能否向我解释一下微观和宏观 F 分数方面的图之间的区别?

1个回答

Micro 通过计算总的真阳性、假阴性和假阳性来全局计算 F 分数。

宏计算每个标签的 F 分数并找到它们的未加权平均值。宏 F 分数没有考虑标签不平衡。

鉴于指标之间的表现存在差异,您的数据在类标签的基本比率中是不平衡的。

向少数类添加更多数据会有所帮助。