通过 CNN 对顶层进行建模的最佳实践

数据挖掘 深度学习 喀拉斯 计算机视觉
2022-02-22 04:26:41

我正在微调 InceptionResnetv2 网络以获得特征提取器,因此我正在用我的数据(一个标签/数据,我使用的是 softmax)训练一个经典分类器。

我想知道如何为顶层(完全连接)选择架构,我读到通常使用 Flatten -> Dense -> Dropout -> Softmax。

如何选择

  • 展平/MaxPool/AvgPool
  • 密集(256)/密集(512)/密集(1024)

是纯粹的经验吗?

1个回答

深度学习主要是一个经验领域,最佳实践是通过反复试验找到的。

由于您正在探索相对较少的超参数组合,因此可以使用网格搜索交叉验证来比较它们。