我目前有 2 个具有数值输出的算法。使用 0.9 的阈值,我得到分类输出。假设它们是:
- P(高精度,低召回率)
- R(高召回率,低精度)
就个人而言,他们的 F-1 分数很差。创建分类器 C 的天真方法是:
C(*) = x.P(*) + (1-x).R(*)
优化 x 和阈值是提高 F-1 分数的好方法吗?或者是否有一些我必须尝试的替代方法。注意:我不能改变函数 P() 和 R()。它们的输出作为黑盒功能提供。
我目前有 2 个具有数值输出的算法。使用 0.9 的阈值,我得到分类输出。假设它们是:
就个人而言,他们的 F-1 分数很差。创建分类器 C 的天真方法是:
C(*) = x.P(*) + (1-x).R(*)
优化 x 和阈值是提高 F-1 分数的好方法吗?或者是否有一些我必须尝试的替代方法。注意:我不能改变函数 P() 和 R()。它们的输出作为黑盒功能提供。
一般来说,这意味着 P 仅预测少数实例高于 0.9,而 R 预测大多数实例高于 0.9。因此,这两个分数的加权平均值将落在中间的某个位置,可能导致中等的精确度和中等的召回率。
这可以给出明显更好的结果,但前提是这两个分类器是互补的,即它们以彼此足够不同的方式预测实例。否则,它相当于在单个分类器上调整阈值。