是否可以使用 DQN 解决魔方?

数据挖掘 Python 深度学习 火炬 dqn
2022-02-15 22:08:38

我正在尝试使用深度学习来解决魔方问题,我遇到了 DQN,所以我决定尝试一下。我开发了所有代码并开始训练,但我得到了以下结果: 在此处输入图像描述

损失上升,测试永远不会得到更好的结果。我试图改变学习率,epsilon 贪婪衰减,将争夺动作减少到一个,但它仍然不能仅仅用一个动作来解决它。这就是为什么我想知道这样做是不可能的,或者我可能会错误地计算一些值。

1个回答

我认为是的,你可以,因为 rubric 组可以表示为网格词环境。

从 GitHub看到这个链接,他们尝试使用 dqn 解决