我正在处理一项任务,即使是 0.00001 fp 速率也是不可接受的,因为当它不是阳性时检测为阳性会在此任务中产生非常糟糕的后果,所以当我使用 k 折叠时,它需要在我的数据集中精确为 0 ,所以每次折叠为 0。基本上我的模型至少应该很好地学习我自己数据集中的所有负样本,并且永远不会错误地将它们分类为正样本。
但是最好的方法是什么?
到目前为止,我想到了两件事,但如果有更好的方法,请告诉我:
在训练期间给正样本一个非常大的权重
正样本的数据增强,因此使正数据集大 100 倍之类的
总结问题:
你正在给一个包含足够平衡数据的二元分类任务,并被要求在给定的数据集上训练一个误报率为 0 的深度神经模型,你会怎么做?(输入昏暗在 1k-3k 左右)