我想使用一个小数据集来创建 CNN 模型。所以,我正在使用数据增强来增加训练数据集。我应该使用此处列出的所有增强技术(参数)吗?
我注意到添加许多参数会降低模型的准确性,并使训练集比测试集更难。
使用时使用数据增强的最佳实践是什么flow_from_directory
?
我想使用一个小数据集来创建 CNN 模型。所以,我正在使用数据增强来增加训练数据集。我应该使用此处列出的所有增强技术(参数)吗?
我注意到添加许多参数会降低模型的准确性,并使训练集比测试集更难。
使用时使用数据增强的最佳实践是什么flow_from_directory
?
增强通常依赖于数据的性质。想象一下,如果扩充的结果在您的上下文中是合乎逻辑的。
例如,假设您有一个猫对狗的数据集。这里的图像可以从左到右翻转。另一方面,在 MNIST 数据集中,翻转图像根本没有意义(将翻转的“3”提供给您的模型有什么好处)。一些增强实际上可能会混淆模型(例如,颠倒的“9”可能看起来像“6”)。
此外,如果增强使您的模型变得更糟,请尝试较小的增强(例如,坚持使用小范围的仿射变换 -旋转/平移/缩放)。