在最近的WaveNet论文中,作者将他们的模型称为具有堆叠的扩张卷积层。他们还制作了以下图表,解释了“常规”卷积和扩张卷积之间的区别。
常规卷积看起来像 这是一个过滤器大小为 2 且步长为 1 的卷积,重复 4 层。
然后他们展示了他们的模型使用的架构,他们称之为扩张卷积。它看起来像这样。 他们说每一层都有(1、2、4、8)的膨胀。但对我来说,这看起来像是一个过滤器大小为 2、步长为 2 的常规卷积,重复了 4 层。
据我了解,一个扩张卷积,过滤器大小为 2,步幅为 1,扩张为 (1, 2, 4, 8),看起来像这样。
在 WaveNet 图中,没有一个过滤器会跳过可用的输入。没有孔。在我的图表中,每个过滤器都会跳过 (d - 1) 个可用输入。这就是扩张应该如何工作的不?
所以我的问题是,以下哪个(如果有的话)命题是正确的?
- 我不明白扩张和/或常规卷积。
- Deepmind 实际上并没有实现扩张卷积,而是跨步卷积,但误用了扩张这个词。
- Deepmind 确实实现了扩张卷积,但没有正确实现图表。
我对 TensorFlow 代码不够流利,无法理解他们的代码到底在做什么,但我确实在 Stack Exchange 上发布了一个相关问题,其中包含可以回答这个问题的代码。