训练 CNN 时,首先要调整的超参数是什么?

人工智能 卷积神经网络 训练 计算机视觉 优化 超参数优化
2021-11-14 14:40:14

我正在训练用于对象检测的卷积神经网络。除了学习率,我还应该调整哪些其他超参数?以及按什么重要性排序?此外,我读到对超参数进行网格搜索并不是进行训练的最佳方式,在这种情况下随机搜索更好。随机搜索真的那么好吗?

1个回答

首先,当您说对象检测 CNN 时,有大量可用的模型架构。考虑到您已经缩小了模型架构的范围,CNN 将有一些常见的层,如下面的,您可以调整超参数:

  1. 卷积层:- 内核数、内核大小、步长、填充
  2. MaxPooling 层:- 内核大小、步长、填充
  3. 致密层:- 大小
  4. 辍学:-保留/下降的百分比