给定输入图的维数、过滤器的数量、步幅和填充,输出图的维数是多少?

人工智能 神经网络 深度学习 卷积神经网络
2021-11-10 13:07:20

我试图了解卷积运算输出的维度。假设一个卷积层具有以下特征:

  • 输入图xRH×W×D
  • 一套F过滤器,每个维度fRH×W×D
  • 一大步<sx,sy>对于相应的xy输入地图的维度
  • 有效或相同的填充(如果可能,请解释两者)

输出映射的预期维度应该是多少,用下式表示H,W,D,F,H,W,sx,sy?

1个回答

以下是考虑到您的变量的答案:

在哪里,pxpy是填充值。(两边相等)。您可以在左侧和右侧使用不同的填充。(类似顶部和底部)。如果填充相同,方程将有2px或者2py,否则您可以在方程式中添加填充和替换的值。(例如pxLeft+pxRight)

填充是可选的。一般来说,经验法则是添加填充,使得上面的等式产生整数,并添加填充,如果步幅为 1,则输出与输入相同,如果步幅为 2,则输出为输入的一半。