我正在学习用于视觉识别的 cs231n 卷积神经网络。讲义介绍了宽度、高度、深度的概念。例如,
在 CIFAR-10 中,图像的大小仅为 32x32x3(32 宽,32 高,3 个颜色通道)
然而,在另一个例子中,
大小为 [55x55x96] 的体积有 96 个深度切片,每个大小为 [55x55]
宽度 96 是什么意思?这是否意味着 96 个颜色通道?为什么我们可以有超过 3 个颜色通道?
我正在学习用于视觉识别的 cs231n 卷积神经网络。讲义介绍了宽度、高度、深度的概念。例如,
在 CIFAR-10 中,图像的大小仅为 32x32x3(32 宽,32 高,3 个颜色通道)
然而,在另一个例子中,
大小为 [55x55x96] 的体积有 96 个深度切片,每个大小为 [55x55]
宽度 96 是什么意思?这是否意味着 96 个颜色通道?为什么我们可以有超过 3 个颜色通道?
这意味着前一个卷积层中的过滤器(又名内核或特征检测器)的数量是 96。您可能想观看讲座的视频,特别是这张幻灯片,其中提到过滤器应用于完整上一层的深度: