DeepMind 的 DQN 是否同时学习所有 Atari 游戏?

人工智能 强化学习 深度学习 dqn 深思熟虑 雅达利游戏
2021-10-20 22:54:10

DeepMind 表示,其深度 Q 网络 (DQN) 能够在学习玩 49 款 Atari 游戏的同时不断调整其行为。

在使用相同的神经网络学习所有游戏之后,代理是否能够同时以“超人”级别玩所有游戏(只要随机呈现其中一款游戏)还是一次只能玩一款游戏,因为切换需要重新学习吗?

2个回答

切换需要重新学习。

另外,请注意

我们在所有七款游戏中使用相同的网络架构、学习算法和超参数设置,表明我们的方法足够强大,可以在不包含特定游戏信息的情况下处理各种游戏。虽然我们在真实且未修改的游戏上评估了我们的代理,但我们仅在训练期间对游戏的奖励结构进行了一项更改。

在我们尝试的七场比赛中,该网络在六场比赛中的表现都超过了之前所有的强化学习算法,并且在其中三场比赛中超过了专家级的人类玩家。

切换需要重新学习,网络没有一套权重可以让它很好地玩所有游戏。这是由于灾难性的遗忘问题。

然而,最近的工作已经完成以克服这个问题克服神经网络中的灾难性遗忘,2016 年,James Kirkpatrick 等人。