我想知道为什么人们通常用零填充而不是使用最小值。我认为,如果您输入的图像的像素范围为 [0, 255] 或 [0, 1](标准化后),则零填充是有意义的。但是,对于隐藏层表示,除非您使用 ReLU 或 Logistic Sigmoid 激活函数,否则对我来说没有多大意义。
例如,如果您按照通常的做法在 [-0.5, 0.5] 范围内对输入图像进行了标准化,那么使用零填充对我来说没有意义(与使用 -0.5 填充相反)。tanH 激活也是如此,因为梯度在 0 处最陡峭。
所以,我想知道为什么人们仍然到处使用零填充?