人工智能 - 有什么方法可以在不使用梯度的情况下训练神经网络？ - 吾爱随笔录

人工智能神经网络训练参考请求随机梯度下降

2021-10-22 03:01:59

我所知道的用于更新神经网络权重的唯一算法是基于梯度的。更新方程可以大致写为

w \leftarrow w - \nabla_{w} L

$w \leftarrow w - \nabla_{w}L$

在哪里 $\nabla_{w}L$ 是损失函数相对于权重的梯度。

有没有不使用梯度的神经网络中更新权重的学习算法？

1个回答

是的。

ML 世界中一类突出的“无梯度”算法被称为进化策略 (ES)。进化算法虽然存在了很长时间，但只有少数几个表现出很好的扩展性。

最近，研究小组 OpenAI 设法用 ES 的特定变体（经过精心设计）训练了 Deep RL 模型。你可以阅读这篇论文。如果您想了解 ES 及其现代衍生产品，David Ha 的这篇博客提供了一个起点。

其它你可能感兴趣的问题