我正在阅读一篇名为“FaceNet: A Unified Embedding for Face Recognition and Clustering”的文章。在那里,他们使用了一种叫做“inception”的东西。我想这与图层有关,但我找不到任何有关它的信息。刚找到一些代码,解释不多。有人可以提供一个线索,我怎样才能正确搜索这个,或者也许,请简单地讲述这个概念?
什么是初始层?
数据挖掘
神经网络
成立之初
2021-09-15 09:41:33
1个回答
问题“FaceNet:人脸识别和聚类的统一嵌入”中引用的论文可在https://arxiv.org/pdf/1503.03832.pdf获得。本文第 5 页列出了 Inception 模块架构的参考文献 [16]。
介绍和描述这种Inception架构的原始论文是 - “Going Deeper With Convolutions”,可在https://www.cs.unc.edu/~wliu/papers/GoogLeNet.pdf访问。
设计这种架构的关键思想是在同一层(初始层)内同时部署具有多个过滤器和池化层的多个卷积。例如,在此图(图 a)所示的架构中,使用 1x1 过滤器以及 3x3 和 5x5 过滤器以及最大池化层的卷积。图 b 展示了使用 1x1 卷积滤波器如何实现降维(因为减少了通道数)。
目的是让神经网络在训练网络时学习到最佳权重,并自动选择更有用的特征。此外,它打算减少数量。的尺寸,所以没有。单元和层数可以在后期增加。这样做的副作用是增加了训练这一层的计算成本。为了解决这个问题,论文中提出了许多解决方案,例如为此架构部署并行计算。
作为对这些概念的说明,第 5 页上的表格显示了这种架构的化身,称为“GoogLeNet”,用于 ILSVRC 2014 竞赛。
其它你可能感兴趣的问题