我训练了一个简单的模型来识别 mnist 数据集中的手写数字。这里是:
model = Sequential([
Conv2D(filters=1, kernel_size=(3,1), padding='valid', strides=1, input_shape=(28, 28, 1)),
Flatten(),
Dense(10, activation='softmax')])
我尝试改变卷积层的过滤器数量,同时保持其他参数不变(学习率 = 0.0001,集数 = 2000,训练批量大小 = 512)。我使用了 1、2、4、8 和 16 个过滤器,每个过滤器的模型准确率都是 92-93%。
据我了解,在训练过程中,过滤器可能会学习识别图像中各种类型的边缘(例如,垂直、水平、圆形)。这个实验让我想知道是否有任何过滤器最终是重复的——具有相同或相似的权重。有什么能阻止他们这样做吗?