根据我的教授的说法,对 NN 建模的第一步是使用足够强大的模型。
第一步是创建一个足够强大的模型,以在训练数据上实现非常高的准确度(非常低的损失),至少在不使用正则化的情况下是这样。
我可以做些什么来使我的模型“足够强大”,换句话说,让它在训练数据上过拟合?
我在以下事情上寻找正确的方向吗?
- 添加额外的图层
- 使层更厚(更多的神经元)
根据我的教授的说法,对 NN 建模的第一步是使用足够强大的模型。
第一步是创建一个足够强大的模型,以在训练数据上实现非常高的准确度(非常低的损失),至少在不使用正则化的情况下是这样。
我可以做些什么来使我的模型“足够强大”,换句话说,让它在训练数据上过拟合?
我在以下事情上寻找正确的方向吗?
以下是一些用于增加模型容量的常规超参数调整:
架构相关:
优化器相关:
Deep Learning Book 中的第 11.4.1 节提供了一个很好的概述。论文“基于梯度的深度架构训练的实用建议”是了解不同超参数效果的另一个很好的来源(虽然它有点旧)。
此外,还有特定的超参数可以增加不同网络类型的模型容量,例如