什么是扩张池以及它在数学上是如何工作的?

数据挖掘 机器学习 深度学习 张量流
2021-10-04 19:48:08

虽然我理解扩张卷积的概念,因为有很多论文对此进行了解释,但我对扩张池的了解较少。

  • 有人可以解释它是什么吗?

  • 它的内部实现是什么?最好举个例子。

2个回答

来自TensorFlow Github

扩张的最大池化只是常规的最大池化,但是您在最大池操作的每个“应用程序”中使用的像素/体素与您使用扩张卷积选择的像素/体素完全相同。

空洞卷积/池化对于连接组学和 3D 形状数据集(3D 深度学习)很有用。

因此,与卷积类似,每第 n 个像素被选择用于操作。

编辑

选择这样的点:

图片

像这样为他们进行池化:

图片 图片来源:

https://www.quora.com/Is-a-pooling-layer-necessary-in-CNN-Can-it-be-replaced-by-convolution

https://www.quora.com/What-is-max-pooling-in-convolutional-neural-networks

编辑2:

2 x 2 最大池化和 3 x 3 膨胀:

0  0  0  0  0  0  0  0  0  0  0  0  0  0
0  0  0  0  0  0  0  0  0  0  0  0  0  0
0  0 (5) 0  0 [6] 0  0 (3) 0  0 [6] 0  0
0  0  0  0  0  0  0  0  0  0  0  0  0  0
0  0  0  0  0  0  0  0  0  0  0  0  0  0
0  0 (3) 0  0 (4) 0  0 (2) 0  0 (4) 0  0
0  0  0  0  0  0  0  0  0  0  0  0  0  0
0  0  0  0  0  0  0  0  0  0  0  0  0  0
0  0 (1  0  0 (2) 0  0 (2) 0  0 (1) 0  0
0  0  0  0  0  0  0  0  0  0  0  0  0  0
0  0  0  0  0  0  0  0  0  0  0  0  0  0
0  0 (3) 0  0 [4] 0  0 [6] 0  0 (3) 0  0
0  0  0  0  0  0  0  0  0  0  0  0  0  0
0  0  0  0  0  0  0  0  0  0  0  0  0  0

变成

6  6
4  6

我发现这张图片有助于快速解释扩张池

3 × 3 卷积核,具有不同的扩张率,分别为 1、2 和 3。参考:CSRNet 上的张晓凡论文。