对 tf.data.Dataset 执行数据增强后,我应该将其与原始 tf.data.Dataset 合并吗?

数据挖掘 深度学习 喀拉斯 图像分类 数据增强
2022-03-09 11:30:17

有点愚蠢的问题,但我读到可以使用数据增强来解决小型数据集的问题。就我而言,我有一个包含 5 个不同类和每个类大约 2k 个示例的数据集。在执行各种图像转换后,我是否将增强数据集与原始数据集合并为一个新的、更大的(大约 20k 图像)数据集,还是我误解了这个过程?

1个回答

是的,尽可能使用所有数据。

数据增强背后的目标实际上是从一组较小的实例中创建更多的数据点。因此,您肯定希望将原始数据保留在其中,因为特别是,这是您拥有的唯一“纯”数据。