表示围绕代理的二维网格

数据挖掘 神经网络 美国有线电视新闻网 强化学习
2022-02-21 15:16:32

我正在尝试训练一个基于神经网络的模型来玩类似于吃豆人的游戏,除了没有迷宫。即,玩家处于二维网格中,在某些位置有食物点,玩家需要弄清楚带着食物走到单元格。

我希望玩家只看到他周围的 11x11 单元格,即一组 11x11 单元格,我们的玩家位于中心,每个单元格中要么有食物,要么没有食物。

我尝试将该数组按原样作为我的神经网络的输入,但它的学习效果很差。这是有道理的,因为这听起来像是一个你会使用卷积层来解决的问题,因为这个数组有点像图像。

但与图像不同的是,我们根本不关心轮廓。与图像不同,最中心单元左右的 2 个单元具有截然不同的含义:玩家左侧和右侧的位置。前者的食物应该鼓励向左走,后者的食物应该鼓励向右走。输入中任何类似间隔的单元格都不是这样。因此,我不认为 CNN 会很合适。

你能想出一种将这个输入表示到神经网络的好方法吗?

1个回答

单元格网格可以作为矩阵输入到神经网络中。矩阵是卷积神经网络 (CNN) 的常见输入形状。

选择输入的简单表示并选择其他深度学习问题常见的表示通常很有用。

以适合深度学习的方式表示输入只是整个工作流程中的一个问题。由于您正在训练类似游戏的代理,因此相对于输入空间表示潜在的未来动作也将具有挑战性。