信息处理 - 如何清理作为边缘检测结果的黑白图像 - 吾爱随笔录

我想从一些背景杂乱的图像中提取文本。

第一步是切换到灰度，应用边缘检测算法，然后稍微清理一下。

这是一个结果示例：

我想使用 tesseract OCR 从中提取文本，但它还不足以找到它，因为背景仍然很混乱。（我尝试使用更清洁的版本，效果还不错）。

那么，任何人都可以推荐一种算法或一种算法来帮助我清理这个图像并获取文本吗？（它总是有这个字体）。

我的一个想法是尝试删除所有比字体“大”的团块，这很薄。

ps：希望这是正确的 stackexchange 站点。