数据挖掘 - 是什么带来了不同数据增强策略在深度学习中的性能差异？ - 吾爱随笔录

数据挖掘深度学习分类数据增强

2022-02-21 02:31:03

我正在研究深度学习模型在胸部 X 光异常检测方面的表现。

由于数据的稀疏性，我使用不同的增强策略来增强数据，包括：

与现有文献相反，我发现这些模型使用传统的增强方法（我在此提到的）比使用 GAN 生成的合成图像显示出有希望的结果。

是什么带来了这种性能差异？

1个回答

通常，在使用数据增强时必须小心。

例如，对这种图像进行旋转是有意义的，我们希望将这些图像中的任何一个视为潜在的“现实生活”示例：

但是，对这种图像进行旋转的意义不大。我们不希望在“现实生活”示例中看到这一点：

GAN 可能使生成的图像变得毫无意义。如果您的 GAN 产生“thrash”增强数据，那么您的网络将训练和学习您不想要的“thrash”。

当你在 GAN 生成的图像上训练你的模型时，你实际上是在训练你的模型来识别 GAN 生成的图像，而不是现实生活中的例子。

其它你可能感兴趣的问题