与 MNIST 或其他基准数据集不同,收集的数据通常带有不合格、不准确的标签。
帮助神经网络不过度拟合噪声的最佳实践是什么?我想到的事情:
渐变剪裁
正则化
调整损失函数(例如Patrini Making Deep Neural CVPR 2017 论文),但他们通常假设噪声与特征无关。你成功使用它们了吗?
数据集蒸馏。你是怎么做到的?你有可以分享的参考资料吗?
我发现很少有关于该主题的论文,但我发现它们非常学术(例如,它们通过随机翻转标签来模拟噪声,它们假设非常大的数据集和计算资源)。有人成功申请了吗?