我有一个大型图像集合,并希望识别该集合中似乎复制该集合中的其他图像的图像。
为了让您了解我希望分类为匹配的图像对类型,请考虑以下示例:
我已经手动分类了大约 0.25 万对匹配图像,现在希望使用这些手动标记的匹配来训练神经网络模型。我只是不确定哪种架构最适合这项任务。
我最初认为连体网络可能是合适的,因为它们已用于类似的任务,但这些分类器的输出似乎更适合于查找同一对象的不同形状(这不是我想要的),而不是不同的打印相同的形状(这是我想要的)。
如果有人可以根据我准备的训练数据帮助推荐非常适合识别图像的论文或架构,我将非常感谢您提供的任何见解。
您需要阅读有关三元组损失函数的信息。三元组损失函数从网络获取结果嵌入,该网络通过网络处理三个图像(两个相似和一个不相似)一步:
之后,损失计算为:
L o s = _∑我= 1ñ[ ∥F一个一世-Fp一世∥22− ∥F一个一世-Fn一世∥22+ α]+大号○ss=∑一世=1ñ[‖F一世一个-F一世p‖22-‖F一世一个-F一世n‖22+α]+
有关更多详细信息,请阅读三重损失作者的论文。
此外,这可能有助于PSNR,但这不是深度学习。
如果图像与您发布的图像更相似,您可以使用结构相似度指数,它给出的输出范围为 -1 到 1。任何超过 0.9 的东西都可以被认为是相似的。