文档布局分析 - 最先进的技术?

数据挖掘 ocr
2021-09-21 19:36:31

文档布局分析的当前最新技术是什么?

即检测列,从文本中分离图像,区分页码和文本等等。

我正在寻找有关该主题的论文和算法。

2个回答

经过一番研究,我遇到了ICDAR(国际文档分析和识别会议),该会议每两年举行一次,似乎是最先进的文档分析算法的最完整和最新的来源。

ICDAR 每年都会在不同的子领域举办比赛。在撰写本文时,ICDAR 2015 的最新结果已作为复杂布局文档识别竞赛 - RDCL2015 发布(在线搜索 PDF 版本。)本文描述了最先进的文档布局分析算法,并将它们的性能与开源和商业解决方案进行了比较。

另请参阅论文LAREX – 一种用于早期印刷书籍布局分析和区域提取的半自动开源工具以及随附的开源解决方案OCR4all

介绍了一种用于早期印刷书籍布局分析的半自动开源工具。LAREX 使用基于规则的连接组件方法,该方法非常快速,用户易于理解,并在必要时允许直观的手动校正。PageXML 格式用于支持与现有 OCR 工作流的集成。评估表明,LAREX 提供了一种有效且灵活的方法来分割早期印刷书籍的页面。