如果你有一个层残差网络与 a层残差网络,如果两个模型都使用相同的训练数据进行训练,为什么前者在对象检测方面比后者做得更好?
更深的残差网络表现更好还是更差?
人工智能
卷积神经网络
物体检测
残差网络
2021-11-17 22:13:21
1个回答
仅通过具有更多参数,较深的模型就比较小的模型具有更高的容量。这意味着理论上它可以学习从数据中提取更复杂的特征。此外,更多层意味着模型可以从数据中提取更高级别的特征。因此,一般来说,对于更困难的任务,更深层次的模型在大多数情况下会胜过浅层模型。
缺点是如果数据量少,大容量的模型有记忆训练集的能力,会导致过拟合。除了性能之外,更深层次的模型还需要更好的硬件和更长的训练时间。因此,有很多理由让人们更喜欢更浅的模型而不是更深的模型。