基于 CNN 的具有多个类的深度模型的性能

数据挖掘 深度学习 图像分类 卷积神经网络
2022-01-30 22:11:28

给定的深度 cnn 模型性能如何随着分类、对象检测分割等任务中的类数量而变化?

例如,mobilenet v2 在使用 PASCAL VOC 的分类任务上给出了大约 90% 的准确率;现在,如果我们只用 2 个类(比如人和狗)训练同一个网络,它将如何影响准确性、速度和模型大小?(比如,使用 tensorflow)。还有对象检测和语义分割等任务的情况(尤其)?

我们可以使网络更小以从更小的数据集(2 类)中学习以达到相同或更好的精度和速度吗?

1个回答

您可能想看看我在硕士论文中描述的层次分类思想。

简而言之:

  • 如果我遇到需要区分 42 种狗和 30 种猫的问题,我很可能只为42+30=72类。采取两步法(首先是猫对狗,然后是猫品种/狗品种)似乎并没有给出更好的结果,而且肯定更复杂
  • 您拥有的课程越少,错误分析就越简单
  • 多个类别/倾斜数据的单一准确度分数没有意义。例如,如果您有两个模型都具有 90% 的准确率,那么一个模型可能比另一个模型好得多。