我正在考虑创建一个 CNN。现在众所周知,CNN 需要很长时间来训练,因此建议坚持使用已知的架构和超参数。
我的问题是:我想修改 CNN 架构(因为它是一项专门的任务)。一种方法是创建一个 CNN 并检查小型数据集,但是我无法知道最后的全连接层是否过度拟合数据而卷积层什么都不做(因为大型 FC 层可以很容易地过拟合数据)。交叉验证是检查它的好方法,但它可能并不令人满意(因为我的观点是,如果数据集足够小并且未来数据几乎没有变化,CNN 可以替换为全连接神经网络——套)。
那么有哪些方法可以修补 CNN 并在合理的训练时间内获得对未来数据集的良好估计?我之前的假设错了吗?一个详细的答案会很好!