我编写了一个具有 1 个隐藏层和 1 个数值输出的神经网络。没有偏见。
By appropiate choice of the activation function, I can easily approximate some continuous function.
然而,即使是简单的事情
f(x) = 50 if x >= 100, and 25 otherwise
我无法使用我的神经网络进行近似。我试过改变学习率,以及隐藏笔记的数量,但它根本不会收敛。
为什么它在这个极其简单的功能上表现如此糟糕?我该怎么做才能使它收敛?不仅仅是这个函数,还有另一个类似的非连续函数。