文档图像消失点检测与评估

信息处理 图像处理 计算机视觉 ocr 光学字符识别
2022-02-20 14:42:07

用手机代替我们的扫描仪,同时用手机进行OCR是很自然的想法。如果能做到这一点,则必须解决两个问题:一个与文档图像二值化有关,另一个与几何畸变校正有关。在所有畸变中,投影畸变最为常见,为了纠正这种畸变,通常必须确定水平消失点和垂直消失点。获得消失点的方法有很多种,不同的方法会导致不同的消失点。然后我的问题是给出几个候选消失点(例如水平消失点)我们如何选择最好的?当然我们可以得到基于每个消失点的投影变换模型,然后对失真图像进行校正。视觉评估校正后的图像可以判断哪个消失点更好。但是我能在修正之前找到最好的消失点吗?谢谢!

2个回答

为什么要使用对消失点敏感的 OCR 技术?

投影失真只是扭曲了字母-对吗?那么,为什么不将那些预期的偏差建模到每个字母的 OCR 模板中呢?此外,附近的字母也会类似地倾斜,因此您可以使用相邻字母之间的相关平行线来估计局部/全局倾斜的数量(并避免处理 VP)。

另外,我假设您的意思是手机会拍下文件的照片,所以您不必担心纸张不平整且曲线线性失真,这在我看来会完全混淆,并取代任何消失你担心的点问题。

也许我会将讨论带到另一个层次,但我不同意您需要明确纠正透视失真甚至二值化图像的事实。许多基于深度学习的最先进技术在执行免校正 OCR 方面相当成功。这些通常被称为“端到端”OCR。他们已经以显着的优势超越了基于处理的同行。快速谷歌搜索产生: