是否可以使用 AI 对嘈杂的文档进行去噪?

人工智能 机器学习 参考请求 光学字符识别
2021-11-09 03:32:28

我有一些包含一些文本(机器书写文本)的文档,我打算在它们上应用 OCR 以提取文本。

问题是这些文档包含很多噪音,但方式不同(一些文档在中间有噪音,其他文档在顶部,等等),这意味着我不能应用简单的阈值来去除噪音(即应用简单的阈值不仅消除了噪音,而且消除了文本的某些部分)。

出于这些原因,我考虑使用 AI 对文档进行去噪。

有谁知道是否可以通过 AI 或任何其他方式做到这一点?

1个回答

这也是图像处理(它具有分析解决方案而不是学习)的主题,主要是通过预先设计的过滤器。滤波器取决于噪声的类型(椒盐、高斯等),即,对于椒盐,选择窗口中的中值。文献中有很多去噪研究。最近还有一些基于学习的去噪应用程序,但它需要数据才能进行训练。