如何标准化图像有一些变化,但大多数似乎使用这两种方法:
- 减去对所有图像计算的每个通道的平均值(例如 VGG_ILSVRC_16_layers)
- 通过对所有图像计算的像素/通道进行减法(例如CNN_S,另见Caffe 的参考网络)
在我看来,自然的方法是标准化每个图像。与夜间图像相比,在光天化日下拍摄的图像会导致更多的神经元被激发,虽然它可能会告诉我们我们通常关心边缘等更有趣特征的时间。
Pierre Sermanet在 3.3.3 中提到了基于每个图像的局部对比度归一化,但我在我见过的任何示例/教程中都没有遇到过这种情况。我还看到了一个有趣的Quora question和Xiu-Shen Wei 的帖子,但他们似乎不支持上述两种方法。
我到底错过了什么?这是一个颜色归一化问题,还是有一篇论文真正解释了为什么这么多人使用这种方法?