我阅读了许多讨论为什么 2D 卷积层通常用于神经网络中的 RGB 图像的线程。我读到可以使用 3D conv 层。
我不明白的是它背后的数学。
假设您的图像是 300 x 300,并且kernel_size = (3, 3)
图层是filter = 16
and 。将是 (300, 300, 3) 因为有 3 个通道 (RGB)。Conv2D
Input_shape
- 由于内核是二维的,因此一次只能在 1 个通道上进行卷积。那是对的吗?
- 3 个通道是否应用/卷积了相同的内核?如果是这样,应该有 3 个输出,但输出的维度是 (298, 298, 16)。它是 3 个通道的平均值吗?