预训练卷积网络上的数据增强/特征提取

数据挖掘 神经网络 特征提取 卷积神经网络 数据增强
2022-02-24 04:10:13

我正在阅读 François Chollet 的“使用 Python 进行深度学习”,这是一本很棒的书。他谈到了使用预训练的卷积网络(在他的示例中为 VGG16),然后运行较小的数据集来调整它们(例如狗 vs 猫 kaggle 数据集)。

我的理解是有两种选择:

1) 从(例如)VGG16 中去掉密集层。通过剩余的卷积层运行小数据集(只有猫和狗)。获取输出,然后训练第二个密集的卷积网络,作为单独的第二步。

2) 从 VGG16 中去掉密集层。将它们替换为从原始卷积网络获取输入的新的、随机初始化的密集层。冻结网络中预先存在的卷积部分,然后用较小的数据集训练整个卷积网络。

根据这本书,方法(2)允许您使用数据增强,但方法(1)不允许。

我不明白为什么会这样,或者为什么这两种方法不同,因为两者实际上都是从固定的卷积层获取输出,然后在其上训练一个更小、更密集的网络。我误解了什么?

0个回答
没有发现任何回复~