哪个模型对卷积神经网络的分类任务有好处?

人工智能 神经网络 卷积神经网络 图像识别 分类
2021-11-06 07:47:44

假设我正在尝试将 CNN 应用于图像分类。有很多不同的模型可供选择,我们可以尝试一个 ensemble,但由于资源有限,它不允许尝试所有的东西。

哪个模型对卷积神经网络的分类任务有好处?

现在,我只是取三个预测的平均值。

predictions_model = [y_pred_xceptionAug,y_pred_Dense121_Aug,y_pred_resnet50Aug]
predictions = np.mean(predictions_model,axis=0)

但是每个模型的性能是不同的。集成方法有更好的方法吗?

1个回答

集成在计算机视觉领域不是很流行。造成这种情况的主要原因是,模型在参数方面已经非常大,以至于很难在内存中拟合多个模型进行分类。由于有有效的方法来训练非常大的模型,如果他们有能力,人们宁愿创建一个更大的网络,而不是对多个网络的结果进行平均。

话虽如此,没有理由说集成不会对您的任务产生有益的结果。

正如您所做的那样,一种方法是对模型的结果进行平均。这通常用于减少较弱模型的偏差。另一种方法是使用元建模,即创建第四个模型(甚至像线性分类器一样简单),将使用三个 CNN 的输出作为其输入特征进行训练。这个想法是元模型将学习对 CNN 的输出进行加权的最佳方法,这样,元模型将学习最好的而不是它们都具有相同的投票权(就像你对它们进行平均时的情况一样)称量它们的方法。