如何将图像拆分为矩形?

数据挖掘 图像识别 aws ocr
2022-03-05 06:19:21

我有一个带标签的表格,人们将在其中添加他们的名字和一系列数字。然后他们会为表格拍照。像这样:

带有数字的矩形

只需将其发送到 AWS Rekognition,我就可以获得不错的结果

Rekognition 的结果

但我觉得如果我能够在将图像发送到 OCR API 之前将其拆分为多个部分,它会做得更好。我可以使用哪些技术来完成此任务?

如果有帮助,我可以修改表格以获得更好的结果。也许使边界或多或少变暗?什么都需要。

1个回答

AWS Rekognition 非常适用于检测打字文本,但不适用于检测手写符号。您可以在您的示例中看到这是正确的。我要做的是检测与单词相关的所有框Problem然后你可以提取一个相对于这个词的位置的框。然后,您将提取每个框中的手写数字。