我正在开发一个图像搜索引擎。该引擎旨在根据用户的输入检索手表。我正在使用 SIFT 描述符来索引数据库中的元素并应用欧几里德距离来获得最相似的手表。我觉得这种类型的描述符不是最好的,因为手表具有相似的结构和形状。目前,最佳匹配和最差匹配之间的平均差异还不够大(15%)
我一直在考虑为描述符添加颜色,但我想听听其他建议。
我正在开发一个图像搜索引擎。该引擎旨在根据用户的输入检索手表。我正在使用 SIFT 描述符来索引数据库中的元素并应用欧几里德距离来获得最相似的手表。我觉得这种类型的描述符不是最好的,因为手表具有相似的结构和形状。目前,最佳匹配和最差匹配之间的平均差异还不够大(15%)
我一直在考虑为描述符添加颜色,但我想听听其他建议。
如何开发一个可以通过相似度对图像进行排序的程序类似于如何开发一个可以根据单词看起来的相似程度对单词进行排序的程序的问题。
例如:“theory”更类似于“teoryyy”而不是“abc”。
决定两个单词或图像相似性的因素是以下因素:
两张图片共有多少个部分
任一图像中有多少零件是新的
任一图像中缺少多少部分
有多少部分被放大/缩小或拉伸。
有多少零件被移位
可能还有其他一些规则。通过结合这些规则,您可以解释相似性识别的工作原理。这是智能的核心。