信息处理 - 为 OCR 处理过滤有点“半色调”的图像 - 吾爱随笔录

信息处理图像处理 ocr

2022-01-02 12:26:49

我有一个扫描的 PDF 材料，我想在其中添加隐藏文本层，这样我就可以索引文档。我使用 ghostscript 黑白 tiff 输出设备 (tiffg4) 将页面提取为 tiff 图像，以下是它们的外观示例：

在此处输入图像描述

用 tesseract 处理这个图像，并没有给出好的结果。
更改 ghostscript 输出 DPI (600, 300, 150, 96) 表明 96 DPI 的图像从 tesseract 获得了最佳结果，但仍不能令人满意。

现在我想征求意见，哪种过滤器可以增强此图像以进行 OCR 处理。

我可以使用 imagemagick 或 numpy/scipy/ndimage

2个回答

您真正需要的可能是一些形态学操作，例如先膨胀后腐蚀。这称为关闭操作。可能在你的情况下 - 只是扩张本身可能是好的。

之前问过一个类似的问题 - 这可以在其他方面有所帮助。

您可以使用低通滤波器将其移除。这要么在频率空间中完成，要么只取图像的（差）高斯。

其它你可能感兴趣的问题