我应该从头开始训练还是使用预先训练的重量?

数据挖掘 数据集 训练 约洛
2022-03-11 12:09:05

使用 yolov4,我正在训练一个 80k 图像数据集,用于对不同种类的鱼进行分类。目前,我正在使用以下预训练的权重:yolov4.conv.137 .

现在我想知道这是使用 COCO 数据集训练的主干还是权重?我会从使用这些预先训练的体重文件中受益还是仅仅从空白开始训练?

1个回答

我的一般直觉说是的,您的模型可能会从预先训练的权重中受益。

但是,在迁移学习中,会发生两件事——

  1. 正迁移——大数据集上的预训练模型在新数据集上训练时表现非常好
  2. 负迁移——大数据集上的预训练模型在新数据集上训练时性能下降

我会建议一个小实验 -

制作鱼数据集的一个小子集,大约 10% ~ 8K 图像,与原始图像具有相同的类比例,并针对这两种情况训练你的模型,使用迁移学习和不使用迁移学习。这个小实验将快速确定哪种方法在您的案例中最成功(Fish 数据集和 YOLOv4)。

更详细的讨论在这里 - https://stats.stackexchange.com/questions/450801/the-negative-transfer-problem-in-machine-learning