深度学习和标签噪声。现实世界的最佳实践

数据挖掘 深度学习
2022-02-22 00:12:24

与 MNIST 或其他基准数据集不同,收集的数据通常带有不合格、不准确的标签。

帮助神经网络不过度拟合噪声的最佳实践是什么?我想到的事情:

  • 渐变剪裁

  • 正则化

  • 调整损失函数(例如Patrini Making Deep Neural CVPR 2017 论文),但他们通常假设噪声与特征无关。你成功使用它们了吗?

  • 数据集蒸馏。你是怎么做到的?你有可以分享的参考资料吗?

我发现很少有关于该主题的论文,但我发现它们非常学术(例如,它们通过随机翻转标签来模拟噪声,它们假设非常大的数据集和计算资源)。有人成功申请了吗?

0个回答
没有发现任何回复~