我正在研究反向传播算法的实现。到目前为止我已经实现的似乎有效,但我不能确定算法是否得到很好的实现,这是我在网络训练测试期间注意到的:
实施规范:
- 一个包含几乎 100000 个原始数据的数据集(3 个变量作为输入,这三个变量之和的正弦作为预期输出)。
- 网络确实有 7 层,所有层都使用 sigmoid 激活函数
当我运行反向传播训练过程时:
- 在第四次迭代中找到了错误的最小成本(错误的最小成本是 140,这正常吗?我期望的远低于那个)
- 在第四次迭代之后,错误的成本开始增加(我不知道它是否正常?)