我目前正在使用 CNN 进行常见的图像分类。
我想同时使用归一化(每个通道减去均值/除以标准差)和数据增强(旋转、颜色、模糊......),但我不知道如何一起使用它们。
我应该使用哪个顺序?
首先使用仅基于原始图像的参数进行归一化,然后对其进行增强(增强归一化图像是相关的?我是否应该禁止某种类型的增强,例如颜色?)
增强数据并基于所有图像应用归一化(使用增强图像计算均值/标准差),这似乎违反直觉。
仅基于原始图像增强数据并应用归一化,这意味着数据并未真正归一化
或者不要同时使用这两种方法
我目前正在使用 CNN 进行常见的图像分类。
我想同时使用归一化(每个通道减去均值/除以标准差)和数据增强(旋转、颜色、模糊......),但我不知道如何一起使用它们。
我应该使用哪个顺序?
首先使用仅基于原始图像的参数进行归一化,然后对其进行增强(增强归一化图像是相关的?我是否应该禁止某种类型的增强,例如颜色?)
增强数据并基于所有图像应用归一化(使用增强图像计算均值/标准差),这似乎违反直觉。
仅基于原始图像增强数据并应用归一化,这意味着数据并未真正归一化
或者不要同时使用这两种方法
您可以使用这两种方法,在我见过的绝大多数示例中,使用通常的顺序是。
这样做,您还可以看到增强阶段的结果,而如果您先对其进行规范化,则无法将其可视化
归一化有助于您的神经网络,因为它确保您的输入数据始终在特定的数字边界内,基本上使网络更容易处理数据并平等对待数据样本。增强创建“新”数据样本,理想情况下应该尽可能接近“真实”而不是合成数据点。所以:
我认为在实践中,有时实际上你按什么顺序做并不重要。根据您对图像应用的转换,之后它们可能仍会被规范化(例如,如果它们被镜像)。
对分布的影响
一个问题可能是增强会干扰数据的分布。但是,您可能会对图像执行线性变换。当您的数据最初处于高斯分布时,它在转换后仍将保持如此,如本文所述。