有没有好的开源(免费)手写 OCR 程序?

信息处理 图像处理 计算机视觉
2022-01-01 02:40:24

标题问了一切。我面前有一个我不太热衷的数据输入任务:50-100 页的手写注销/登录日志。

日志的格式可能会有所帮助。页面被划分为清晰划定的行和列(13r x 6c,带有额外键入的标题行)。进一步帮助我的是三列与日期/时间相关(日期、超时、时间)。此外,其中两列(资源和名称)中的数据或多或少被枚举,因此,例如,名称“Smith”可能会一次又一次地出现在名称列中,每次都使用相同的笔迹。最后一列“Notes”是自由格式,但如果我可以自动化前 6 列,我不介意手动输入 Notes。

有什么建议?(除了“开始打字”。)

PS如果有更好的SE网站问这个,让我知道,我会在那里问。

2个回答

tesseract可能是最好和最广泛的 OCR 库。

它已经过手写测试,还不错——虽然手写不是一件容易阅读的事情。http://arxiv.org/ftp/arxiv/papers/1003/1003.5893.pdf

如果您的页面少于 10 页,Captricity可以免费提供。

开箱即用,没有好的开源解决方案可以满足您的需求。付费解决方案的许可成本很高。这是基于我们在Captricity构建手写 OCR 服务的经验我们确实在生产中使用了 tesseract,但仅作为与人类智能(众包)相结合的投票,以提供高水平的质量。

希望有帮助!