制作高 F1 分数的集成模型

数据挖掘 分类 集成建模 二进制 f1score
2022-02-24 12:34:29

我目前有 2 个具有数值输出的算法。使用 0.9 的阈值,我得到分类输出。假设它们是:

  1. P(高精度,低召回率)
  2. R(高召回率,低精度)

就个人而言,他们的 F-1 分数很差。创建分类器 C 的天真方法是:

C(*) = x.P(*) + (1-x).R(*)

优化 x 和阈值是提高 F-1 分数的好方法吗?或者是否有一些我必须尝试的替代方法。注意:我不能改变函数 P() 和 R()。它们的输出作为黑盒功能提供。

1个回答

一般来说,这意味着 P 仅预测少数实例高于 0.9,而 R 预测大多数实例高于 0.9。因此,这两个分数的加权平均值将落在中间的某个位置,可能导​​致中等的精确度和中等的召回率。

这可以给出明显更好的结果,但前提是这两个分类器是互补的,即它们以彼此足够不同的方式预测实例。否则,它相当于在单个分类器上调整阈值。