考虑我们正在运行分类器的情况(实际的分类算法在这里无关紧要),并且基于分数给出类标签。如果 score > 0,则数据点标记为 A,如果 score < 0,则数据点标记为 B。
所有的训练数据都包含分数为正或负的数据点。但是,在我的测试数据中,有几个点返回 score = 0。在某些点无法分类到任何类别的情况下,我应该如何测量精度和召回率?
[来自下面评论的附加信息]我在情绪分类任务中遇到了这个问题。归一化分数在 [-1,1] 范围内,0 是没有情感的文档的分数。碰巧我的训练数据中没有中性文档,但在测试数据中,一些文档返回了 0 分。