关于 OCR 应用中的噪声消除的文献

信息处理 图像处理 参考请求
2022-02-10 23:25:58

有人能指出对 OCR 应用程序从扫描文本中去除噪声的技术最有用的核心文本或文章吗?

1个回答

谷歌研究有一些优秀的论文,例如:

Tesseract OCR 引擎概述

此外,stackoverflow 似乎也有类似的问题:

https://stackoverflow.com/questions/4180629/ocr-and-image-preprocessing-techniques

我所知道的最强大的图像过滤技术是基于图形切割的,它按以下步骤运行:

  1. 计算像素之间的(稀疏)距离矩阵(基于它们的强度)
  2. Spectral Clustering,只保留最低的3-8个特征向量
  3. 特征向量的 K 均值聚类