机器算法验证 - Keras 中的数据增强：我最终得到了多少训练观察结果？ - 吾爱随笔录

我正在阅读 Francois Chollet 的“使用 Python 进行深度学习”，最近了解到一个我在统计研究中从未遇到过的概念。即，数据增强。我对以下代码的作用有疑问（出现在本书的第 141 页）：

train_datagen = ImageDataGenerator(rescale=1./255,
                                   rotation_range=40,
                                   width_shift_range=0.2,
                                   height_shift_range=0.2,
                                   shear_range=0.2,
                                   zoom_range=0.2,
                                   horizontal_flip=True,)

test_datagen = ImageDataGenerator(rescale=1./255)

train_generator = train_datagen.flow_from_directory(train_dir,
                                                    target_size = (150,150)
                                                    batch_size = 32,
                                                    class_mode='binary')

history = model.fit_generator(
     train_generator,
     steps_per_epoch=100,
     epochs=100,
     validation_data=validation_generator,
     validation_steps=50)

我想知道的是 ImageDataGenerator() 是如何工作的。例如，如果我有一个包含 2000 个图像的训练目录，数据增强会创建超过 2000 个观察值来训练吗？我如何知道/控制开发了多少观察？

先感谢您。