边界框可以进一步提高 CNN 分类器的性能吗?

人工智能 卷积神经网络 物体检测 物体识别 边界框
2021-11-04 01:36:03

假设我有一个标准的图像分类问题(即 CNN 显示单个图像并预测它的单个分类)。如果我要使用边界框来包围目标图像(即将其转换为对象检测问题),这是否会纯粹通过使用边界框来提高分类精度?

我很好奇当我们向它展示边界框而不是仅仅向它展示整个图像并让它自己解决所有问题时,我们是否可以“协助”神经网络。

4个回答

另一种提问方式是:去除背景噪音后声音是否会变得更清晰?

显而易见的答案是肯定的,在图像分类的情况下,答案通常也是肯定的。

在大多数情况下,减少噪声(不相关的像素)会增强神经网络试图寻找的信号(激活)。

当然,这可能会有所帮助。您从图像中删除了过多的信息,并使分类任务更加简单。但是您需要记住,边界框可能无法完美运行,并且分类算法的准确性可能会受到输入损坏(当边界框损坏时)的影响。

边界框之外的信息仍然可以用作上下文。所以不要丢失它,您可以将边界框作为像素蒙版添加到额外的“伪彩色”层中。这样你也可以在不改变输入架构的情况下拥有许多边界框。您将在不丢失任何内容的情况下提供网络附加信息,因此结果至少不会更糟。

可以想象使用分割网络作为处理的第一步。然后将与每个分割对象的边界框对应的区域馈送到分类器。

这可能会提高对图像中的对象进行分类的性能,但并非没有训练时间的成本,因为突然间有两个网络需要训练,而不仅仅是一个。