我有个标记的图像,每个都有 224x224 像素和 5 个不同的图像通道。当很小(小于 2000)时,使用这些数据训练 CNN 架构的最佳方法是什么?是否可以将每个通道视为单独的图像,还是将所有通道同时输入到输入层更好?
如何用多通道图像训练卷积神经网络?
机器算法验证
深度学习
图像处理
卷积神经网络
火车
2022-03-20 16:43:22
2个回答
您应该将每个图像作为尺寸为 224x224x5 的体积来处理。您仍然像往常一样对前 2 维进行 2D 卷积,但保留整个第 3 维。例如,如果您使用 7x7 的卷积窗口,每个过滤器将产生一个 224x224x1 的体积作为输出(步幅 = 1 和零填充),整个卷积层将产生一个 224x224xN 的体积,其中 N 是过滤器的数量. ConvNetJS和许多其他的 conv 网络库采用这种方法。
关于你的第二个问题:
当 mm 很小(小于 2000)时,使用这些数据训练 CNN 架构的最佳方法是什么?
有一些常见的方法可以人为地增加训练集的大小,例如添加抖动或进行一些变换,如旋转。