用于图像特征提取的 SIFT 的当代替代方案?

数据挖掘 分类 图像分类 图像识别
2021-09-17 04:08:01

我一直在学习SIFT以及它的描述符可用于执行不同任务的所有方式。

我对 SIFT 可用于图像分类的方式特别感兴趣。(例如,Niester & Stewenius 2006 年的一篇论文依赖 SIFT 描述符来构建词汇树)。

然而,11 年后的 2017 年,深度学习已经在许多方面取代了经典方法。

有哪些替代方法可以找到截至 2017 年已显示出更有希望的结果的图像特征描述符?

2个回答

Geoff Hinton等人胶囊网络。基于与 SIFT 类似的想法:事实上,如果您查看 2011 年的论文,Hinton等人的Transforming Auto-Encoders 。他们明确引用 SIFT 作为 Capsules 的灵感来源。

主要思想是他们用一种称为胶囊的新型单元构建了一个网络,该单元输出一个向量(而不是像我们在传统神经网络中所知道的那样输出标量的神经元)。

您可以将这些向量视为 SIFT 关键点和特征描述符的类似物,但好处是它们可以通过反向传播来学习。

Sabour、Frost 和 Hinton最近发表了一篇文章,即胶囊之间的动态路由,对此进行了详细阐述,结果显示出非常有希望的结果。

我在 AI Stack Exchange 上写了 Capsule Networks 的简短摘要,请参阅问题Capsule Networks 背后的主要概念是什么?.

根据您的需要,您应该查看:

  1. 全卷积网络(FCN)获取输入图像的掩码

  2. ResNets 用于非常深的网络(101 层)

  3. MaskRCNN 用于实例分割