在 OCR 中,我应该如何处理椭圆对象侧面的扭曲文本?
人工智能
Python
图像处理
数据预处理
光学字符识别
2021-10-23 06:25:54
1个回答
有很多关于这方面的论文,但以下是一个好的开始:
- 如何以编程方式打开葡萄酒标签。作者在 Python 中包含源代码。
您提到您不想做全景视图,但这有不止一个含义。如果我假设您的意思是您不想在拍摄多张照片时旋转罐子,或者您不想从不同角度拍摄多张照片,您可以尝试使用pericentric lens。这将需要一些图像处理来进行展开。由于包裹更加严重,因此需要更高的分辨率。但优点是您将拥有完整圆柱表面的单个图像,并且不会遗漏任何特征或文本。
其它你可能感兴趣的问题