从视频流中重新识别卡片

数据挖掘 神经网络 分类 图像分类 计算机视觉
2022-03-13 19:23:27

我想制作一个移动应用程序,您可以在其中使用相机进行扫描,它会为您提供刚刚扫描的卡片。(来自棋盘游戏)
我得到了每张现有卡片的 PNG,但我真的不知道该使用什么。

目前,我一直在使用 OCR 使用卡片中的文本来查找卡片,但它并不是 100% 准确,因为排版非常特别。

我一直在考虑使用图像分类,但我不确定这是不是正确的方法,因为我要为数百个课程进行培训。(获得超过 400 多张不同的卡片)

你知道我应该用什么吗?(如果这似乎是一个基本问题,我很抱歉,但我刚刚开始学习 CV 和 ANN)
感谢您的帮助!

1个回答

第一种方法:

您可能可以在您拥有的图像上训练一个 CNN(卷积神经网络)。如果图像数量较少,我更喜欢你使用迁移学习

在迁移学习中,我们有一个训练有素的模型(如 Inception、ResNet),我们对其进行修改,以便它可以对我们需要的图像进行分类。

第二种方法:

使用对象检测。您需要从图像中定位一个对象(卡片),然后对该裁剪后的图像进行分类。如果您是初学者,这可能会很乏味。

您可以参考这些链接:

您需要训练一个可以跟踪和裁剪图像(卡片)的本地化模型。