我所知道的用于更新神经网络权重的唯一算法是基于梯度的。更新方程可以大致写为
在哪里是损失函数相对于权重的梯度。
有没有不使用梯度的神经网络中更新权重的学习算法?
我所知道的用于更新神经网络权重的唯一算法是基于梯度的。更新方程可以大致写为
在哪里是损失函数相对于权重的梯度。
有没有不使用梯度的神经网络中更新权重的学习算法?
是的。
ML 世界中一类突出的“无梯度”算法被称为进化策略 (ES)。进化算法虽然存在了很长时间,但只有少数几个表现出很好的扩展性。
最近,研究小组 OpenAI 设法用 ES 的特定变体(经过精心设计)训练了 Deep RL 模型。你可以阅读这篇论文。如果您想了解 ES 及其现代衍生产品,David Ha 的这篇博客提供了一个起点。