如何清理作为边缘检测结果的黑白图像

信息处理 图像处理 边缘检测 ocr 文本识别
2022-02-03 15:08:02

我想从一些背景杂乱的图像中提取文本。

第一步是切换到灰度,应用边缘检测算法,然后稍微清理一下。

这是一个结果示例:

我想使用 tesseract OCR 从中提取文本,但它还不足以找到它,因为背景仍然很混乱。(我尝试使用更清洁的版本,效果还不错)。

那么,任何人都可以推荐一种算法或一种算法来帮助我清理这个图像并获取文本吗?(它总是有这个字体)。

我的一个想法是尝试删除所有比字体“大”的团块,这很薄。

ps:希望这是正确的 stackexchange 站点。

1个回答

事实证明,解决这个问题的诀窍就是意识到每一帧背景都在变化,但文本保持不变。因此,通过|对几个连续帧的像素值进行操作,仅获取文本非常简单。