OCR背后的算法是什么?

信息处理 ocr
2022-02-18 23:11:38

我很好奇光学字符识别背后的算法和基本原理。

谁能解释一下:

  • 可以从头开始很容易实现的最基本的 OCR 算法?还是不同 OCR 算法之间的共同点?
  • 为应用特定目标定制算法而进行的扩展/更改?

另请参阅我关于 OCR的后续问题。

1个回答

最简单的 OCR 算法可能是字符来自已知字体的情况,在没有扭曲或旋转的完美行中,然后您可以通过与已知字符进行互相关来找到文本中每个字符的出现次数已知字体。

或者更简单,如果您可以在使用之前创建字体,使用更便宜的方式来识别字符,例如MICR 字体OCR 字体