我正在阅读 Francois Chollet 的“使用 Python 进行深度学习”,最近了解到一个我在统计研究中从未遇到过的概念。即,数据增强。我对以下代码的作用有疑问(出现在本书的第 141 页):
train_datagen = ImageDataGenerator(rescale=1./255,
rotation_range=40,
width_shift_range=0.2,
height_shift_range=0.2,
shear_range=0.2,
zoom_range=0.2,
horizontal_flip=True,)
test_datagen = ImageDataGenerator(rescale=1./255)
train_generator = train_datagen.flow_from_directory(train_dir,
target_size = (150,150)
batch_size = 32,
class_mode='binary')
history = model.fit_generator(
train_generator,
steps_per_epoch=100,
epochs=100,
validation_data=validation_generator,
validation_steps=50)
我想知道的是 ImageDataGenerator() 是如何工作的。例如,如果我有一个包含 2000 个图像的训练目录,数据增强会创建超过 2000 个观察值来训练吗?我如何知道/控制开发了多少观察?
先感谢您。
