人工智能 - 深度排名/对书籍封面进行分类的最佳方法？ - 吾爱随笔录

人工智能图像识别

2021-11-11 12:43:02

我最近看到一篇关于深度排名的论文。我想知道这是否可以用来将书籍封面分类为书名。（例如，如果我有第二本书的封面图片，分类器将返回哈利波特与密室。）

例如，假设我有一个书籍封面数据集以及文本中的书名。该数据集可以用于这种深度排名算法，还是有更好的方法来解决我的问题？我对这一切都很陌生，这是我在这个领域的第一个项目。

我正在尝试创建一个移动应用程序，人们可以在其中拍摄书籍封面的照片，让算法/神经网络对书名进行分类，然后让其他算法将其连接到书的 Goodreads 页面。

谢谢您的帮助！

2个回答

我读了一些关于它的论文，你可以看看它们也许对你有帮助。

该数据集可以用于这种深度排名算法吗？

是的你可以！我认为这项任务至少有两种方法：

首先，使用图像分类解决。如果你想使用深度学习，你可以使用深度卷积神经网络来创建分类器来判断图像是否是 HP 书。您可以阅读 Mahmoud 回答中提到的论文。但问题是你需要一个非常大的数据集，要制作一个好的分类器，你不能只为一本书提供一张图像，所以如果你有一千本书（或更多），你需要用非常庞大的数据集训练你的模型。
使用图像相似度或基于内容的图像检索 (CBIR)，Stackoverflow 中有一个关于这个主题的很好的讨论，有很多技术，包括 Deep Ranking、perceptual hash 等。他们的区别之一是 Deep Ranking 使用的特征工程技术比其他技术少。在我看来，使用图像相似性技术比使用图像分类更好（它也在 Deep Ranking 论文中进行了比较），因为有些方法会更快并且不需要大量数据集。

其它你可能感兴趣的问题