在 150 多个类上训练单个模型是否可行?

数据挖掘 神经网络 深度学习 美国有线电视新闻网
2022-03-13 14:17:00

我有不同地区的课程。(假设每个 3 个区域的 80 个类)。如果我用 240 个类训练我的 CNN 模型,或者我应该为每个区域创建 3 个模型,可以吗?每个区域的类与具有相同名称的其他区域的类相似,但是每个区域的每个类的元素存在一些差异,因此给出了一些其他类名称。

我目前有一个训练有素的模型,它可以为一个具有 80 个类别的区域提供良好的准确性。现在我必须使用剩​​余的课程,如果我事先知道训练一个具有 240 个类别的单个模型或三个不同的模型,每个模型有 80 个类别,这将节省时间。

我平均每个班级有 300 张图片。

2个回答

分类器的质量取决于每个类的可用观察数。如上所述,如果每个类有 300 张图像,那可能就足够了(这取决于数据的质量)。无论如何,这将需要大量的数据增强

如果您没有适当的基础架构,那么在 240 个课程上训练一个网络可能会非常具有挑战性。这一切都取决于训练时间,但我建议您将问题分解为较小的子问题。这也将使调试和改进更容易实现。

趋势:拥有一个模型将提供更好的结果,因为您包含更多信息。有很多课程并不是一个真正的问题。一些图像识别模型在 1000 多个类上进行了训练。如果您有足够的数据(行/观察),问题就更多了。每个班级平均 300 张图像听起来很合理。所以我会尝试一下大型模型(包括所有类)。此外,如果我对您的理解正确,您使用的是预训练模型,这可能非常有益。