我最近看到一篇关于深度排名的论文。我想知道这是否可以用来将书籍封面分类为书名。(例如,如果我有第二本书的封面图片,分类器将返回哈利波特与密室。)
例如,假设我有一个书籍封面数据集以及文本中的书名。该数据集可以用于这种深度排名算法,还是有更好的方法来解决我的问题?我对这一切都很陌生,这是我在这个领域的第一个项目。
我正在尝试创建一个移动应用程序,人们可以在其中拍摄书籍封面的照片,让算法/神经网络对书名进行分类,然后让其他算法将其连接到书的 Goodreads 页面。
谢谢您的帮助!
我最近看到一篇关于深度排名的论文。我想知道这是否可以用来将书籍封面分类为书名。(例如,如果我有第二本书的封面图片,分类器将返回哈利波特与密室。)
例如,假设我有一个书籍封面数据集以及文本中的书名。该数据集可以用于这种深度排名算法,还是有更好的方法来解决我的问题?我对这一切都很陌生,这是我在这个领域的第一个项目。
我正在尝试创建一个移动应用程序,人们可以在其中拍摄书籍封面的照片,让算法/神经网络对书名进行分类,然后让其他算法将其连接到书的 Goodreads 页面。
谢谢您的帮助!
该数据集可以用于这种深度排名算法吗?
是的你可以!我认为这项任务至少有两种方法:
首先,使用图像分类解决。如果你想使用深度学习,你可以使用深度卷积神经网络来创建分类器来判断图像是否是 HP 书。您可以阅读 Mahmoud 回答中提到的论文。但问题是你需要一个非常大的数据集,要制作一个好的分类器,你不能只为一本书提供一张图像,所以如果你有一千本书(或更多),你需要用非常庞大的数据集训练你的模型。
使用图像相似度或基于内容的图像检索 (CBIR),Stackoverflow 中有一个关于这个主题的很好的讨论,有很多技术,包括 Deep Ranking、perceptual hash 等。他们的区别之一是 Deep Ranking 使用的特征工程技术比其他技术少。在我看来,使用图像相似性技术比使用图像分类更好(它也在 Deep Ranking 论文中进行了比较),因为有些方法会更快并且不需要大量数据集。
您还可以阅读图像相似度的另一个简单参考。