基于内容的图像检索的可能图像特征列表

信息处理 图像处理 cbir
2021-12-23 03:55:22

我正在尝试查找可能的图像特征列表,如颜色、定向边缘等,以测量它们在图像中找到相同/相似对象时的可用性。有谁知道这样的列表或至少一些功能?

4个回答

这个领域本身太广阔了。所以我怀疑你可以在这里有一个完整的清单。然而,MPEG 7是该领域标准化的主要努力之一。所以这里包含的内容并不普遍——但至少是最基本的。

以下是 MPEG7 中确定的一些关键功能集(我真的只能谈论视觉描述符,其他人看不到的全部范围)。

有 4 类视觉描述符:

1.颜色描述符,包括:
主色、
颜色布局(基本上是逐块的原色)
可缩放颜色(基本上是颜色直方图)、
颜色结构(基本上是局部颜色直方图)
和颜色空间,以使事物可互操作。

2.纹理描述符(另见此,包括:
纹理浏览描述符 - 定义粒度/粗糙度、规律性和方向。同质纹理描述符 - 基于 Gabor 滤波器组。
边缘直方图

3.形状描述符,其中包括:
基于区域的描述符是考虑中形状的标量属性 - 例如面积、偏心等。
基于轮廓的捕获实际特征形状特征和
3D 描述符

4. Motion Descriptors for Video
Camera Motion (3-D camera motion parameters)
Motion Trajectory (of object in the scene in the scene) [例如通过跟踪算法提取] Parametric Motion(例如运动向量,它允许描述场景的运动。但它可以对各种对象进行更复杂的模型)。
Activity 更像是一个语义描述符。


MPEG 7 没有定义“这些是如何提取的”——它只定义了它们的含义以及如何表示/存储它们。因此,关于如何提取和使用它们的研究确实存在。

这是另一篇很好的论文,可以深入了解这个主题。

但是,是的,其中许多功能都是相当基本的,可能更多的研究将创建更复杂(和复杂)的功能集。

好的,我想我只需多搜索一下就找到了合适的列表。Deselaers 等人有一篇论文。哪些接缝是我要找的!

还有一本书捆绑了一组与该主题相关的论文。它被称为视觉信息检索原理

@Dipan Mehta 介绍了可以使用的特征描述符。现在让我尝试通过提及一些提取对CBIR有益的特征的特征检测方法来涵盖硬币的另一面

我的CBIR研究参考是Sivic、ZissermanNister、Stewenius的论文。这些作者有更多当前的论文,但这些论文提出了所有相关的想法。

他们认为,要实现有效的CBIR方法,应该使用互补属性的特征:

  • 形状适应区域- 倾向于以角状特征

    示例: Harris 角点、多尺度 Harris、DoG(高斯差 - 但也响应边缘!)

  • 最大稳定区域- 倾向于以类似斑点的特征

    示例: MSER(最大稳定外部区域)、DoG

令人惊讶的是,维基百科还提供了一个很好的特征(检测器)类型分类,说明了他们检测到的大多数当前广泛使用的特征的兴趣区域类型:

  • 边缘检测器
  • 角落探测器
  • 斑点检测器
  • 脊探测器

我读过的大多数当前文章都发誓,SIFT(尺度不变特征变换)描述符非常可靠,并且足够稳健,可以与所选特征检测器结合使用。参考资料包括:

笔记!这些论文并未严格处理CBIR ,而是在CBIR相关工作中用作参考。

最后,值得一提的是,成功的CBIR方法不仅依赖于使用的特征检测器描述符,还依赖于:

  • 高效的搜索结构(视觉特征的量化)
  • 构建图像描述符的方法——要么基于共同的视觉特征(局部描述符),要么通过比较全局图像描述符(这是一个非常新的想法,所以目前没有参考)
  • 图像描述符之间的距离度量

另外,我已经回答了一些关于DSPstackoverflow上的CBIR的问题,都附有参考资料和解释,我认为它们可能是相关的,所以你可能想看看: