更深的残差网络表现更好还是更差?

人工智能 卷积神经网络 物体检测 残差网络
2021-11-17 22:13:21

如果你有一个18层残差网络与 a32层残差网络,如果两个模型都使用相同的训练数据进行训练,为什么前者在对象检测方面比后者做得更好?

1个回答

仅通过具有更多参数,较深的模型就比较小的模型具有更高的容量这意味着理论上它可以学习从数据中提取更复杂的特征。此外,更多层意味着模型可以从数据中提取更高级别的特征因此,一般来说,对于更困难的任务,更深层次的模型在大多数情况下会胜过浅层模型。

缺点是如果数据量少,大容量的模型有记忆训练集的能力,会导致过拟合除了性能之外,更深层次的模型还需要更好的硬件和更长的训练时间。因此,有很多理由让人们更喜欢更浅的模型而不是更深的模型。