我正在尝试对很少出现(在图像中)的对象进行检测,并计划在滑动/调整大小的窗口中使用 CNN 二元分类器。我已经构建了平衡的 1:1 正负训练和测试集(顺便说一句,在这种情况下这样做是正确的吗?),并且分类器在测试集的准确性方面做得很好。现在我想控制我的分类器的召回/精度,例如,它不会错误地标记太多的多数类出现。
明显的(对我来说)解决方案是使用现在使用的相同逻辑损失,但是通过将两种情况之一的损失乘以某个常数,权重类型 I 和类型 II 错误不同,可以调整。这样对吗?
PS 再想一想,这相当于对某些训练样本的权重大于其他样本。我认为只需添加更多的一类就可以达到同样的效果。