解决网格世界的最佳学习自动机强化模式,帮助我

数据挖掘 机器学习 强化学习
2022-02-13 23:49:29

我有一个gridworld puzzel、一个 agent 和 Target ,我想找到通过 agent 到达 Target 的最佳路径。

gridworld 示例(以 S 为起点,G 为目标点,黑色单元格为悬崖): 在此处输入图像描述

0个回答
没有发现任何回复~