我正在尝试查找可能的图像特征列表,如颜色、定向边缘等,以测量它们在图像中找到相同/相似对象时的可用性。有谁知道这样的列表或至少一些功能?
基于内容的图像检索的可能图像特征列表
这个领域本身太广阔了。所以我怀疑你可以在这里有一个完整的清单。然而,MPEG 7是该领域标准化的主要努力之一。所以这里包含的内容并不普遍——但至少是最基本的。
以下是 MPEG7 中确定的一些关键功能集(我真的只能谈论视觉描述符,其他人看不到它的全部范围)。
有 4 类视觉描述符:
1.颜色描述符,包括:
主色、
颜色布局(基本上是逐块的原色)
可缩放颜色(基本上是颜色直方图)、
颜色结构(基本上是局部颜色直方图)
和颜色空间,以使事物可互操作。
2.纹理描述符(另见此),包括:
纹理浏览描述符 - 定义粒度/粗糙度、规律性和方向。同质纹理描述符 - 基于 Gabor 滤波器组。和
边缘直方图
3.形状描述符,其中包括:
基于区域的描述符是考虑中形状的标量属性 - 例如面积、偏心等。
基于轮廓的捕获实际特征形状特征和
3D 描述符
4. Motion Descriptors for Video
Camera Motion (3-D camera motion parameters)
Motion Trajectory (of object in the scene in the scene) [例如通过跟踪算法提取] Parametric Motion(例如运动向量,它允许描述场景的运动。但它可以对各种对象进行更复杂的模型)。
Activity 更像是一个语义描述符。
MPEG 7 没有定义“这些是如何提取的”——它只定义了它们的含义以及如何表示/存储它们。因此,关于如何提取和使用它们的研究确实存在。
这是另一篇很好的论文,可以深入了解这个主题。
但是,是的,其中许多功能都是相当基本的,可能更多的研究将创建更复杂(和复杂)的功能集。
好的,我想我只需多搜索一下就找到了合适的列表。Deselaers 等人有一篇论文。哪些接缝是我要找的!
还有一本书捆绑了一组与该主题相关的论文。它被称为视觉信息检索原理。
@Dipan Mehta 介绍了可以使用的特征描述符。现在让我尝试通过提及一些提取对CBIR有益的特征的特征检测方法来涵盖硬币的另一面。
我的CBIR研究参考是Sivic、Zisserman和Nister、Stewenius的论文。这些作者有更多当前的论文,但这些论文提出了所有相关的想法。
他们认为,要实现有效的CBIR方法,应该使用互补属性的特征:
形状适应区域- 倾向于以角状特征为
示例: Harris 角点、多尺度 Harris、DoG(高斯差 - 但也响应边缘!)
最大稳定区域- 倾向于以类似斑点的特征
示例: MSER(最大稳定外部区域)、DoG
令人惊讶的是,维基百科还提供了一个很好的特征(检测器)类型分类,说明了他们检测到的大多数当前广泛使用的特征的兴趣区域类型:
- 边缘检测器
- 角落探测器
- 斑点检测器
- 脊探测器
我读过的大多数当前文章都发誓,SIFT(尺度不变特征变换)描述符非常可靠,并且足够稳健,可以与所选特征检测器结合使用。参考资料包括:
- 已经提供了链接
- Mikolajczyk, Schmid处理局部描述符的比较
- Dahl评估检测器-描述符组合
笔记!这些论文并未严格处理CBIR ,而是在CBIR相关工作中用作参考。
最后,值得一提的是,成功的CBIR方法不仅依赖于使用的特征检测器和描述符,还依赖于:
- 高效的搜索结构(视觉特征的量化)
- 构建图像描述符的方法——要么基于共同的视觉特征(局部描述符),要么通过比较全局图像描述符(这是一个非常新的想法,所以目前没有参考)
- 图像描述符之间的距离度量
另外,我已经回答了一些关于DSP和stackoverflow上的CBIR的问题,都附有参考资料和解释,我认为它们可能是相关的,所以你可能想看看: