是什么带来了不同数据增强策略在深度学习中的性能差异?

数据挖掘 深度学习 分类 数据增强
2022-02-21 02:31:03

我正在研究深度学习模型在胸部 X 光异常检测方面的表现。

由于数据的稀疏性,我使用不同的增强策略来增强数据,包括:

  • 传统的增强方法(高斯平滑、非锐化掩蔽和最小滤波)
  • 生成对抗网络

与现有文献相反,我发现这些模型使用传统的增强方法(我在此提到的)比使用 GAN 生成的合成图像显示出有希望的结果。

是什么带来了这种性能差异?

1个回答

通常,在使用数据增强时必须小心。

例如,对这种图像进行旋转是有意义的,我们希望将这些图像中的任何一个视为潜在的“现实生活”示例: 在此处输入图像描述


但是,对这种图像进行旋转的意义不大。我们不希望在“现实生活”示例中看到这一点: 在此处输入图像描述


GAN 可能使生成的图像变得毫无意义。如果您的 GAN 产生“thrash”增强数据,那么您的网络将训练和学习您不想要的“thrash”。

当你在 GAN 生成的图像上训练你的模型时,你实际上是在训练你的模型来识别 GAN 生成的图像,而不是现实生活中的例子。

资料来源:- 朝向数据科学-quora问题