在玩了太多愤怒的小鸟之后,我开始观察自己的策略。事实证明,我开发了一种非常具体的方法来在每个级别上获得 3 颗星。
这让我想知道开发一个能够玩《愤怒的小鸟》的机器学习系统所面临的挑战。与游戏互动并发射小鸟是微不足道的。但我的一个问题是关于系统的“构建块”。
机器学习系统似乎使用简单的概念或对问题的理解。这通常被编码为作为输入的特征。因此,系统似乎需要具备理解一些高级概念的能力才能生成策略。
这是真的?此外,开发这样一个系统的挑战或困难部分是什么?
编辑#1:
这里有一些澄清。获得 3 星是一个难题,因为您必须最大化积分。这可以通过两种非排他性的方式来完成: 1) 尽量减少使用的鸟的数量(每只未使用的鸟您将获得 10,000 分)。2)最大限度地破坏玻璃、木头等物体。每个被摧毁的物体都会给你积分。一只鸟可以摧毁超过10,000点的物体。
这是关于“高级概念”的更多解释。为了最大化上述点,您需要使用每只鸟的特殊力量。因此,这意味着根据地图的布局发射具有不同轨迹的不同鸟类。而且,在玩游戏时,我制定了一种策略,以特定的顺序用特定的鸟类摧毁特定区域。
似乎如果不了解如何使用每只鸟来摧毁特定区域,系统就无法学会获得 3 颗星。那么,你如何管理和编码这样的东西呢?您如何确保系统可以学习这些高级概念?