盗梦空间 v2 和盗梦空间 v3 有什么区别?

数据挖掘 图像分类 计算机视觉 卷积神经网络 成立之初
2021-09-29 23:30:01

论文Going deep with convolutions描述了包含原始初始模块的 GoogleNet:

在此处输入图像描述

inception v2 的变化是他们用两个连续的 3x3 卷积替换了 5x5 卷积并应用了池化:

在此处输入图像描述

盗梦空间 v2 和盗梦空间 v3 有什么区别?

4个回答

在论文Batch Normalization中,Sergey 等人,2015。在论文Going deep with convolutions中提出了Inception-v1架构,它是GoogleNet的一个变体,同时他们将 Batch Normalization 引入了 Inception(BN-Inception)。

与 (Szegedy et al.,2014) 中描述的网络的主要区别在于,5x5 卷积层被两个连续的 3x3 卷积层替换,最多 128 个过滤器。

Rethinking the Inception Architecture for Computer Vision一文中,作者提出了 Inception-v2 和 Inception-v3。

Inception-v2中,他们引入了 Factorization(将卷积分解为更小的卷积),并对 Inception-v1 进行了一些小的改动。

请注意,我们已将传统的 7x7 卷积分解为三个 3x3 卷积

至于Inception-v3,它是 Inception-v2 的变体,增加了 BN-auxiliary。

BN 辅助是指辅助分类器的全连接层也归一化的版本,而不仅仅是卷积。我们将模型 [Inception-v2 + BN 辅助] 称为 Inception-v3。

除了daoliker提到的

inception v2 使用可分离卷积作为深度 64 的第一层

从纸上引述

我们的模型在第一个卷积层上采用了深度乘数为 8 的可分离卷积。这降低了计算成本,同时增加了训练时的内存消耗。

为什么这很重要?因为它在 v3 和 v4 以及 inception resnet 中被删除,但后来在mobilenet中重新引入并大量使用

答案可以在 Going deep with convolutions 论文中找到:https ://arxiv.org/pdf/1512.00567v3.pdf

检查表 3。Inception v2 是 Going deep with convolutions 论文中描述的架构。Inception v3 是相同的架构(微小的变化),但训练算法不同(RMSprop、标签平滑正则化器、添加具有批量规范的辅助头以改进训练等)。

实际上,上面的答案似乎是错误的。确实,命名是一个很大的混乱。但是,它似乎在介绍 Inception-v4 的论文中得到了修复(参见:“Inception-v4, Inception-ResNet and the Impact of Residual Connections on Learning”):

Inception 深度卷积架构在 (Szegedy et al. 2015a) 中作为 GoogLeNet 被引入,这里命名为 Inception-v1。后来,Inception 架构以各种方式进行了改进,首先是通过引入批量标准化(Ioffe 和 Szegedy 2015)(Inception-v2)。后来在第三次迭代(Szegedy et al. 2015b)中添加了额外的分解想法,在本报告中将被称为 Inception-v3。