如何自动检测模糊的文档图像

信息处理 图像处理 离散信号
2022-01-24 07:08:11

我的问题与图像质量评估有关。假设您要对一组文档图像执行 OCR(光学字符识别)。然而,有些图像非常模糊,对于这些图像,需要进行盲反卷积。但是,有些好的图像不需要反卷积。那么我的问题是:我是否可以找到一个标准来自动将这些图像分为两组:模糊图像和清晰图像,然后在执行 OCR 时对它们进行不同的处理?

1个回答

是的,但这样做很困难。您基本上假设当图像中充分存在某个特征时,您可以应用过滤器并实现 OCR 精度的提高。这意味着您可以找到正确的特征、应用正确的过滤器并正确评估 OCR 准确性。由于有许多可能相关的特征(边缘突出、高频能量、PSF 估计、未过滤的图像 OCR 准确度指标(如@Matt 提到的)等),因此有很多可用的过滤器(反卷积),你需要大量的真实图像来证明系统的有效性,你正在寻找大量的工作和实验来创建一个运行良好的系统。

您还需要确保您没有使用 OCR 软件本身,它可能会进行自己的图像处理以提高其准确性。换句话说,确保去模糊引入的伪影不会使 OCR 准确性变差,即使从去模糊的角度来看去模糊做得“很好”。

话虽如此,应该可以做到这一点。您甚至可以通过自动和迭代地调整参数和方法以优化结果来自适应地执行此操作。