在小数据集上从零开始与迁移学习和 CNN 进行比较

数据挖掘 机器学习 神经网络 美国有线电视新闻网 迁移学习
2022-02-18 15:34:34

我正在使用 CNN 进行图像分类,我有一个包含 3200 个图像的训练集和一个包含 400 个图像的训练集。我使用了两种不同的方法来进行这种分类:迁移学习和从头开始构建 CNN。

在迁移学习的情况下,我得到了 85% 的准确率,在从头开始构建网络的情况下,我得到了 89% 的准确率。

但是通常使用小数据集不应该转移学习有更好的表现吗?

首先要考虑的一件事是我使用了早期停止作为正则化技术,在迁移学习的情况下,这在 epoch 18 停止了训练过程,而对于 CNN,我从头开始到了 epoch 100,这是数字我为训练强加的时代。

有人可以帮我解决我的疑问吗?提前致谢。

1个回答

他们现在有更好的表现。

如果你继续重新训练你的预训练神经网络,你会为你手头的数据集进行越来越多的专业化,并收敛到 89%。

但更重要的是,如果您使用一些预先训练的模型,例如基于ImageNet数据集的模型,您将能够更好地泛化。换句话说,对于测试数据中与训练中的图像(或保留/新集)不同的任何图像,您将在迁移学习中表现得更好。