我正在尝试训练一个基于神经网络的模型来玩类似于吃豆人的游戏,除了没有迷宫。即,玩家处于二维网格中,在某些位置有食物点,玩家需要弄清楚带着食物走到单元格。
我希望玩家只看到他周围的 11x11 单元格,即一组 11x11 单元格,我们的玩家位于中心,每个单元格中要么有食物,要么没有食物。
我尝试将该数组按原样作为我的神经网络的输入,但它的学习效果很差。这是有道理的,因为这听起来像是一个你会使用卷积层来解决的问题,因为这个数组有点像图像。
但与图像不同的是,我们根本不关心轮廓。与图像不同,最中心单元左右的 2 个单元具有截然不同的含义:玩家左侧和右侧的位置。前者的食物应该鼓励向左走,后者的食物应该鼓励向右走。输入中任何类似间隔的单元格都不是这样。因此,我不认为 CNN 会很合适。
你能想出一种将这个输入表示到神经网络的好方法吗?