我是深度学习的新手,仍在学习如何从头开始训练我的神经网络。有时我会在 YouTube 上观看教程,甚至在 MOOC 平台上观看在线课程。卷积神经网络的基础通常具有 Conv2D 和 MaxPooling 层,以使输入更小且易于训练。
问题是这个在线教程有时会使用具有更多神经元的 Conv2D 的设置,然后是其他具有较小神经元的 Conv2D。比如第 1 层是 Conv2D(512...),第 2 层是 Conv2D(256....) 等等。另一个教程设置是递增的,例如从 Conv2D(16....) 开始,然后是 Conv2D(32....) 并递增。这些老师没有告诉我们为什么他们这样编码设置。
我们如何知道使用哪种设置?它们之间有什么区别吗?在网上找不到如何参考这个案例。如果有一篇论文已经描述了这个案例,我希望得到它,谢谢。
