假设我们正在讨论应用于图像的 2D 卷积。
在灰度图像中,数据是维度为的矩阵,其中是图像的宽度,是其高度。在彩色图像中,我们通常有 3个通道:红色、绿色和蓝色;这样,彩色图像可以表示为维度为的矩阵,其中是通道数,即 3。
卷积层接收图像(的激活图作为输出。卷积中的输入通道数为,而输出通道数为。
或 3 或 4 等,CNN 是否会对数据的融合表示进行操作?还是一次在每个通道上运行,然后叠加结果?假设我有 4 个通道,每个通道都是一个 2D 矩阵,那么 CNN 会在内部形成 4 个通道的融合并做出某种表示吗?
