在训练 CNN 之前,我应该删除覆盖数据集中某些图像的文本吗?

人工智能 卷积神经网络 图像处理 数据预处理 数据增强 图像识别
2021-10-21 10:27:24

如果我试图在一些图像数据上训练 CNN 以执行图像分类,但其中一些图像有一些文本覆盖它们(为了向人类描述),那么 CNN 删除文本是否更好?如果是这样,那么我该如何删除文本?此外,将带有文本覆盖的图像和带有已删除文本的图像用于训练是否是一个好主意,因为它可能充当数据增强的一种形式?

1个回答

删除覆盖的文本可能会提高准确性,但您需要训练不同的模型来执行此操作,这是一项完全不同的任务,因为它不再是分类,而是生成。有更简单的方法来扩充您的数据,并且可能会为您的准确性带来类似的好处。但是,如果您仍然想这样做,您可以通过在 google 中简单搜索“水印去除机器学习”找到很多示例。这是我找到的一个例子。

总体而言,CNN 将能够毫无问题地查看覆盖文本,并像没有覆盖文本一样执行分类。有可能它实际上学习了覆盖文本和预期输出之间的关系,但这取决于数据,并且可能比简单地识别特征更难。

您可能会遇到的唯一问题是,如果将使用此模型的真实数据与提供的数据不同,因为在真实文字中,图像不包含描述图像内容的重叠文本。