我一直在学习SIFT以及它的描述符可用于执行不同任务的所有方式。
我对 SIFT 可用于图像分类的方式特别感兴趣。(例如,Niester & Stewenius 2006 年的一篇论文依赖 SIFT 描述符来构建词汇树)。
然而,11 年后的 2017 年,深度学习已经在许多方面取代了经典方法。
有哪些替代方法可以找到截至 2017 年已显示出更有希望的结果的图像特征描述符?
我一直在学习SIFT以及它的描述符可用于执行不同任务的所有方式。
我对 SIFT 可用于图像分类的方式特别感兴趣。(例如,Niester & Stewenius 2006 年的一篇论文依赖 SIFT 描述符来构建词汇树)。
然而,11 年后的 2017 年,深度学习已经在许多方面取代了经典方法。
有哪些替代方法可以找到截至 2017 年已显示出更有希望的结果的图像特征描述符?
Geoff Hinton等人的胶囊网络。基于与 SIFT 类似的想法:事实上,如果您查看 2011 年的论文,Hinton等人的Transforming Auto-Encoders 。他们明确引用 SIFT 作为 Capsules 的灵感来源。
主要思想是他们用一种称为胶囊的新型单元构建了一个网络,该单元输出一个向量(而不是像我们在传统神经网络中所知道的那样输出标量的神经元)。
您可以将这些向量视为 SIFT 关键点和特征描述符的类似物,但好处是它们可以通过反向传播来学习。
Sabour、Frost 和 Hinton最近发表了一篇文章,即胶囊之间的动态路由,对此进行了详细阐述,结果显示出非常有希望的结果。
我在 AI Stack Exchange 上写了 Capsule Networks 的简短摘要,请参阅问题Capsule Networks 背后的主要概念是什么?.
根据您的需要,您应该查看:
全卷积网络(FCN)获取输入图像的掩码
ResNets 用于非常深的网络(101 层)
MaskRCNN 用于实例分割