卷积神经网络中图像的深度是多少?

数据挖掘 神经网络 图像分类 卷积神经网络 计算机视觉
2021-09-21 02:41:01

我正在学习用于视觉识别的 cs231n 卷积神经网络。讲义介绍了宽度、高度、深度的概念。例如,

在 CIFAR-10 中,图像的大小仅为 32x32x3(32 宽,32 高,3 个颜色通道)

然而,在另一个例子中,

大小为 [55x55x96] 的体积有 96 个深度切片,每个大小为 [55x55]

宽度 96 是什么意思?这是否意味着 96 个颜色通道?为什么我们可以有超过 3 个颜色通道?

1个回答

这意味着前一个卷积层中的过滤器(又名内核或特征检测器)的数量是 96。您可能想观看讲座的视频,特别是这张幻灯片,其中提到过滤器应用于完整上一层的深度:

在此处输入图像描述