我是机器学习和人工智能的新手,如果这很明显,请原谅我。我正在和一位朋友讨论如何解决这个问题,但我们都不知道该怎么做。
假设我有一个 100x100 块的网格区域,我想要一个机器人构建一个 100x100 的水平网格,高 3 个块。我得到一个随机但已知的起始表面,始终为 100x100,但随机表面的高度可以在 1 到 5 个方块之间变化。我有多余的积木可以捡起来,所以不用担心用完。机器人可以向任何方向移动,甚至是对角线移动,但需要付出一些代价。机器人显然可以移动一个 4 高的块来填充一个 2 高的块,所以每个块的设计高度都是 3。这听起来像是一个强化学习问题,但是谁能更详细地解释我将如何做到这一点, a) 最小化移动量,b) 到达设计表面。