Python中的水印检测

数据挖掘 深度学习 喀拉斯 图像分类 卷积神经网络
2021-10-06 03:56:54

我有很多图像,我希望能够将它们分为两组:一组包含带水印的图像,另一组包含没有任何水印的图像。

大约有 40 种不同的水印。我创建了“假”水印图像来训练 CNN,它在“假”验证集上效果很好,但在真实图像上却不行。另外,这是一个很长的镜头,因为我需要为每个水印训练一个模型(而且我没有原始水印)或训练一个大模型。

我放弃了水印方法来尝试查找文本。所以我尝试了 OpenCV 文本检测,但它真的不起作用,因为文本是弯曲的,并且与背景没有什么不同。

我错过了一个简单的解决方案吗?任何想法都是受欢迎的。我对机器学习有点陌生:)

1个回答

有趣的问题!也许Keras中的预训练模型可以提供帮助。要么通过迁移学习,因此您可能只需要手动标记少量图像即可重新训练更高层。或者通过使用它们进行特征提取,看看某个关键字是否经常出现在带水印的图像中。

或者只是将图片上传到不允许水印的地方,看看它们是否被标记;-)