我正在为多标签分类问题训练神经网络,所以我的最后一层由n_classessigmoid 神经元组成。
现在,我知道由于噪音和我的特征缺乏可预测的能力,不可能完成学习任务。但是,我假设可预测的能力应该足以至少对某些数据点做出良好的预测。即使这些案例只是少数,如果神经网络至少能获得确定性(高精度)并且由于难度(低召回率)而错过绝大多数情况,我会很高兴。
当然,我可以正常训练模型,然后设置符合我目标的阈值,但这并不能说服我。我想在训练过程中介绍这个目标。如果某些点难以分类,我希望我的神经网络在训练期间发现这一点,忘记它们并专注于其他更可行的情况。
到目前为止,我唯一的想法是通过标签平滑使训练对异常值具有鲁棒性。
像这样在训练期间影响模型的任何其他想法?