为什么尺寸缩小到6 × 66×6在胶囊网络中?

人工智能 神经网络 机器学习 深度学习 卷积神经网络 胶囊神经网络
2021-10-26 13:18:21

我想在面部表情识别(FER)上尝试胶囊网络。目前,我使用的是 fer2013 Kaggle 数据集。

在胶囊网络中我不明白的一件事是在第一个卷积层中,大小减小到 20x20 - 输入图像为 28x28,过滤器为 9x9,步幅为 1。但是,在胶囊中,尺寸减小到 6x6。

这怎么发生的?因为输入大小为 20x20,过滤器为 9x9 和 2 步长,我无法得到 6x6。也许我错过了什么。

对于我的实验,输入大小的图像是 48x48。我应该在开始时使用相同的超参数还是有任何建议的超参数可以使用?

1个回答

在第一个 Conv 层之后,主 caps 的大小减小到 20x20,即卷积 caps 层 n final = (n + 2p -f )/s + 1,它给出了 6x6 输出和 256 个通道

6x6x256 通过重塑通道被进一步编码为 8 个维度的胶囊,即 256/8 = 32,这给出了 6x6x32 = 1152 个胶囊

首先尝试使用相同的超参数,然后尝试通过对超参数进行适当的更改来编码更高级别的特征。