2D 步幅是什么意思?

人工智能 卷积神经网络 定义 大步
2021-11-10 17:11:08

我知道当它只是一个整数时stride有什么意义(你应该在哪一步对图像应用过滤器)。但是大约(1, 1)甚至更多维度的步幅?

1个回答

只有在进行 1D 卷积时,您的步幅才会只是一个整数。进行 2D 卷积时,您会得到 2 个整数,如您的示例:(1, 1).

当步幅有多个维度时,每个维度都将独立应用于其相关维度,并且应计算适合该区域或体积的所有有效组合。

2D 步幅定义了一个矩形网格,其中包含应用操作的点。第一个数字是沿第一 (x) 轴的网格点之间的距离,第二个数字是沿第二 (y) 轴的网格点之间的距离。您可以决定通过对每个维度使用不同的数字来对每个维度进行不同的下采样。

在 TensorFlow 中常见的是 4D 步幅参数,其轴为(例如,高度、宽度、通道)。通常你不想跳过普通 CNN 中的任何示例或通道,即使框架可以做到这一点,所以你会看到使用 stride 仅对图像高度进行下采样时使用的值(1、2、2、1)和层之间的宽度尺寸。