我对神经网络很陌生,但我对线性代数和卷积数学的理解相当不错。
我试图理解我在网上各个地方找到的示例代码,用于训练带有 MNIST 数据的 Keras 卷积 NN 以识别数字。我的期望是,当我创建一个卷积层时,我必须指定一个过滤器或一组过滤器以应用于输入。但是我发现的三个样本都创建了一个像这样的卷积层:
model.add(Convolution2D(nb_filter = 32, nb_row = 3, nb_col = 3,
border_mode='valid',
input_shape=input_shape))
这似乎将总共 32 个 3x3 过滤器应用于 CNN 处理的图像。但是那些过滤器是什么?我将如何在数学上描述它们?keras 文档没有帮助。
提前致谢,