我使用 scipy.optimize.minimize (共轭梯度)优化函数在 python 中构建了一个人工神经网络。
我已经实现了梯度检查,仔细检查了所有内容等,我很确定它工作正常。
我已经运行了几次,它达到了“优化成功终止”,但是当我增加隐藏层的数量时,假设的成本在它成功终止后会增加(其他一切都保持不变)。
直觉上,当隐藏层的数量增加时,似乎成本应该降低,因为它能够生成更复杂的假设,可以更好地拟合数据,但情况似乎并非如此。
我有兴趣了解这里发生了什么,或者我是否错误地实现了神经网络?