为 OCR 处理过滤有点“半色调”的图像

信息处理 图像处理 ocr
2022-01-02 12:26:49

我有一个扫描的 PDF 材料,我想在其中添加隐藏文本层,这样我就可以索引文档。我使用 ghostscript 黑白 tiff 输出设备 (tiffg4) 将页面提取为 tiff 图像,以下是它们的外观示例:

在此处输入图像描述

用 tesseract 处理这个图像,并没有给出好的结果。
更改 ghostscript 输出 DPI (600, 300, 150, 96) 表明 96 DPI 的图像从 tesseract 获得了最佳结果,但仍不能令人满意。

现在我想征求意见,哪种过滤器可以增强此图像以进行 OCR 处理。

我可以使用 imagemagick 或 numpy/scipy/ndimage

2个回答

您真正需要的可能是一些形态学操作,例如先膨胀后腐蚀。这称为关闭操作可能在你的情况下 - 只是扩张本身可能是好的。

之前问过一个类似的问题 - 这可以在其他方面有所帮助。

单色(1 位黑白)图像转换

如何仅使用形态学操作从图像中重建文本?

您可以使用低通滤波器将其移除。这要么在频率空间中完成,要么只取图像的(差)高斯。

高斯低通,然后高斯差进行锐化