我正在研究深度学习模型在胸部 X 光异常检测方面的表现。
由于数据的稀疏性,我使用不同的增强策略来增强数据,包括:
- 传统的增强方法(高斯平滑、非锐化掩蔽和最小滤波)
- 生成对抗网络
与现有文献相反,我发现这些模型使用传统的增强方法(我在此提到的)比使用 GAN 生成的合成图像显示出有希望的结果。
是什么带来了这种性能差异?
我正在研究深度学习模型在胸部 X 光异常检测方面的表现。
由于数据的稀疏性,我使用不同的增强策略来增强数据,包括:
与现有文献相反,我发现这些模型使用传统的增强方法(我在此提到的)比使用 GAN 生成的合成图像显示出有希望的结果。
是什么带来了这种性能差异?
通常,在使用数据增强时必须小心。
例如,对这种图像进行旋转是有意义的,我们希望将这些图像中的任何一个视为潜在的“现实生活”示例:

但是,对这种图像进行旋转的意义不大。我们不希望在“现实生活”示例中看到这一点:

GAN 可能使生成的图像变得毫无意义。如果您的 GAN 产生“thrash”增强数据,那么您的网络将训练和学习您不想要的“thrash”。
当你在 GAN 生成的图像上训练你的模型时,你实际上是在训练你的模型来识别 GAN 生成的图像,而不是现实生活中的例子。
资料来源:- 朝向数据科学-quora问题