深度排名/对书籍封面进行分类的最佳方法?

人工智能 图像识别
2021-11-11 12:43:02

我最近看到一篇关于深度排名的论文。我想知道这是否可以用来将书籍封面分类为书名。(例如,如果我有第二本书的封面图片,分类器将返回哈利波特与密室。)

例如,假设我有一个书籍封面数据集以及文本中的书名。该数据集可以用于这种深度排名算法,还是有更好的方法来解决我的问题?我对这一切都很陌生,这是我在这个领域的第一个项目。

我正在尝试创建一个移动应用程序,人们可以在其中拍摄书籍封面的照片,让算法/神经网络对书名进行分类,然后让其他算法将其连接到书的 Goodreads 页面。

谢谢您的帮助!

2个回答

我读了一些关于它的论文,你可以看看它们也许对你有帮助。

深度神经网络学会通过封面判断书籍

按封面和标题分类的书籍类型

该数据集可以用于这种深度排名算法吗?

是的你可以!我认为这项任务至少有两种方法:

  1. 首先,使用图像分类解决。如果你想使用深度学习,你可以使用深度卷积神经网络来创建分类器来判断图像是否是 HP 书。您可以阅读 Mahmoud 回答中提到的论文。但问题是你需要一个非常大的数据集,要制作一个好的分类器,你不能只为一本书提供一张图像,所以如果你有一千本书(或更多),你需要用非常庞大的数据集训练你的模型。

  2. 使用图像相似度或基于内容的图像检索 (CBIR),Stackoverflow 中有一个关于这个主题的很好的讨论,有很多技术,包括 Deep Ranking、perceptual hash 等。他们的区别之一是 Deep Ranking 使用的特征工程技术比其他技术少。在我看来,使用图像相似性技术比使用图像分类更好(它也在 Deep Ranking 论文中进行了比较),因为有些方法会更快并且不需要大量数据集。

您还可以阅读图像相似度的另一个简单参考