人工智能 - 强化学习和进化算法有什么区别？ - 吾爱随笔录

强化学习和进化算法有什么区别？

人工智能强化学习比较遗传算法优化进化算法

2021-11-13 00:12:37

强化学习 (RL) 和进化算法 (EA) 有什么区别？

我正在尝试了解 RL 的基础知识，但我还没有 RL 的实践经验。我对 EA 的了解略多一些，但不足以理解 RL 和 EA 之间的区别，这就是为什么我要询问它们的主要区别。

1个回答

进化算法 (EA)是受生物进化启发的一系列算法，可用于解决（约束或非约束）优化问题，其中需要优化的函数不一定需要可微分（或满足任何强约束） . 在 EA 中，您通常只需要定义

解决方案的编码（又名染色体或个体）
确定每个解决方案的相对质量的适应度函数
随机改变或组合解决方案的操作（例如遗传算法中的交叉或变异算子）

您还需要定义其他参数（例如每一代要考虑的解决方案的数量或运行算法的代数），但这是尝试解决问题时要考虑的三个最重要的事情EA（特别是 GA）的优化问题。

强化学习（RL）是研究代理如何在特定环境中顺序采取行动以最大化长期奖励（又名回报）的概念的领域。决定代理行为（即代理采取哪些行动）的策略称为策略。因此，RL 的目标是找到最大化（预期）回报的策略，这取决于环境的奖励函数。例如，在国际象棋的情况下，奖励函数可以是任何函数，如果你赢了游戏，它会给你一个正数，如果你输了它，它会给你一个负数。RL 算法通常假设代理能够与环境交互以了解其动态。

因此，RL 关注特定类型的优化问题，即寻找最大化回报的策略（策略），同时代理以时间步长与环境交互。另一方面，EA 可以应用于任何优化问题，您可以在其中编码解决方案，定义比较解决方案的适应度函数，并且您可以随机更改这些解决方案。本质上，EA 几乎可以应用于任何优化问题。原则上，您可以使用 EA 来查找策略，只要您能够将它们与适应度函数（例如，您通过遵循这些策略获得的奖励量）进行比较。

当然，这并不意味着 EA 是解决所有优化问题的最有效和最合适的方法！当您需要解决某些不存在更好方法的问题时，您通常会使用 EA。例如，当您的目标函数不可微时，则不能应用基于梯度的解决方案，因此，在这种情况下，EA 可能是一个可行的选择（但也有 EA 的其他替代方案，例如模拟退火）。

其它你可能感兴趣的问题

上一篇代理功能和代理程序有什么区别？下一篇词嵌入是特征提取的一种形式吗？