数据挖掘 - 从视频流中重新识别卡片 - 吾爱随笔录

数据挖掘神经网络分类图像分类计算机视觉

2022-03-13 19:23:27

我想制作一个移动应用程序，您可以在其中使用相机进行扫描，它会为您提供刚刚扫描的卡片。（来自棋盘游戏）
我得到了每张现有卡片的 PNG，但我真的不知道该使用什么。

目前，我一直在使用 OCR 使用卡片中的文本来查找卡片，但它并不是 100% 准确，因为排版非常特别。

我一直在考虑使用图像分类，但我不确定这是不是正确的方法，因为我要为数百个课程进行培训。（获得超过 400 多张不同的卡片）

你知道我应该用什么吗？（如果这似乎是一个基本问题，我很抱歉，但我刚刚开始学习 CV 和 ANN）
感谢您的帮助！

1个回答

第一种方法：

您可能可以在您拥有的图像上训练一个 CNN（卷积神经网络）。如果图像数量较少，我更喜欢你使用迁移学习。

在迁移学习中，我们有一个训练有素的模型（如 Inception、ResNet），我们对其进行修改，以便它可以对我们需要的图像进行分类。

第二种方法：

使用对象检测。您需要从图像中定位一个对象（卡片），然后对该裁剪后的图像进行分类。如果您是初学者，这可能会很乏味。

您可以参考这些链接：

您需要训练一个可以跟踪和裁剪图像（卡片）的本地化模型。

其它你可能感兴趣的问题