数据挖掘 - 制作高 F1 分数的集成模型 - 吾爱随笔录

数据挖掘分类集成建模二进制 f1score

2022-02-24 12:34:29

我目前有 2 个具有数值输出的算法。使用 0.9 的阈值，我得到分类输出。假设它们是：

就个人而言，他们的 F-1 分数很差。创建分类器 C 的天真方法是：

C(*) = x.P(*) + (1-x).R(*)

优化 x 和阈值是提高 F-1 分数的好方法吗？或者是否有一些我必须尝试的替代方法。注意：我不能改变函数 P() 和 R()。它们的输出作为黑盒功能提供。

1个回答

一般来说，这意味着 P 仅预测少数实例高于 0.9，而 R 预测大多数实例高于 0.9。因此，这两个分数的加权平均值将落在中间的某个位置，可能导致中等的精确度和中等的召回率。

这可以给出明显更好的结果，但前提是这两个分类器是互补的，即它们以彼此足够不同的方式预测实例。否则，它相当于在单个分类器上调整阈值。

其它你可能感兴趣的问题