有什么方法可以在不使用梯度的情况下训练神经网络?

人工智能 神经网络 训练 参考请求 随机梯度下降
2021-10-22 03:01:59

我所知道的用于更新神经网络权重的唯一算法是基于梯度的。更新方程可以大致写为

wwwL

在哪里wL是损失函数相对于权重的梯度。

有没有不使用梯度的神经网络中更新权重的学习算法?

1个回答

是的。

ML 世界中一类突出的“无梯度”算法被称为进化策略 (ES)进化算法虽然存在了很长时间,但只有少数几个表现出很好的扩展性。

最近,研究小组 OpenAI 设法用 ES 的特定变体(经过精心设计)训练了 Deep RL 模型。你可以阅读这篇论文如果您想了解 ES 及其现代衍生产品,David Ha 的这篇博客提供了一个起点。