我正在学习 OCR 并正在阅读这本书
作者定义了 8 个流程来实现 OCR,这些流程一一遵循(2 在 1 之后,3 在 2 之后等):
- 光学扫描
- 位置分割
- 预处理
- 分割
- 表示
- 特征提取
- 认出
- 后期处理
这就是他们写的关于表示的内容(#5)
第五个 OCR 组件是表示。图像表示在任何识别系统中都扮演着最重要的角色之一。在最简单的情况下,灰度级或二进制图像被馈送到识别器。然而,在大多数识别系统中,为了避免额外的复杂性并提高算法的准确性,需要更紧凑和更有特征的表示。为此,为每个类提取一组特征,有助于将其与其他类区分开来,同时保持类内特征差异的不变性。字符图像表示方法通常分为三大类:(a)全局变换和系列扩展 (b) 统计表示和 (c) 几何和拓扑表示。
这就是他们写的关于特征提取的内容(#6)
第六个 OCR 组件是特征提取。特征提取的目的是捕获符号的基本特征。特征提取被认为是模式识别中最困难的问题之一。描述字符最直接的方式是通过实际的光栅图像。另一种方法是提取某些表征符号的特征,但留下不重要的属性。提取这些特征的技术分为三组,即。(a) 点分布 (b) 变换和级数展开和 (c) 结构分析。
我完全糊涂了。我不明白什么是代表。据我了解,分割后我们必须从图像中获取一些特征,例如像弗里曼链码这样的拓扑结构,并且必须与学习阶段模型中保存的一些特征相匹配——即进行识别。换句话说——分割——特征提取——识别。我不明白在代表阶段必须做什么。请解释。