游戏AI可以学习加速的概念吗?

人工智能 机器学习 游戏-ai
2021-11-06 16:20:32

如果游戏具有可变速度并且对于进化/获得分数至关重要(IDK AI 术语)。人工智能是否能够弄清楚何时减速和加速?

如果它能够解决问题或完成关卡,它是否有一个与加速度相关的方程,或者可能是一个关于何时加速和减速的数字。如果游戏环境是动态的呢?

你甚至可以向人工智能教授数学吗?

PS:我不确定我是否应该提出单独的问题?

2个回答

这个答案主要假设您指的是通过体验游戏学习的计算机游戏机器人,例如用于玩 Atari 控制台游戏的 Deep Mind 的 DQN。这些的最先进技术通常是强化学习算法,与神经网络一起使用来处理输入和估计下一步动作的结果。还有其他具有竞争力的人工智能技术,答案通常适用于大多数学习或进化的优化器,他们会通过玩游戏通过反复试验来学习。

如果游戏具有可变速度并且对于进化/获得分数至关重要(IDK AI 术语)。人工智能是否能够弄清楚何时减速和加速?

是的,只要游戏允许控制影响加速的事物,那么学习代理就可以找出加速和制动的后果,并在游戏中适当地使用它们。

一个可以挑战学习代理的著名玩具示例称为Mountain Car在那个游戏中,智能体必须学会在正确的方向(并不总是朝着它的目标)加速,才能逃离一个区域。它被认为具有挑战性,因为与最能实现它的行动相比,奖励(用于逃避)可能会显着延迟。

学习代理的一个流行试验场是 OpenAI 健身房。这包括几个包含加速物理模型的游戏环境,例如Lunar Lander

如果它能够解决问题或完成关卡,它是否会有一个与加速度相关的方程?

一般来说,没有。代理将通过采取加速或减速其控制的游戏块的动作来学习对某些刺激做出反应。不会有任何概念s=ut+12at2编码在代理的参数中。

或者也许是关于何时加速和减速的数字?

通常,代理会通过加速来了解应该响应哪些刺激。例如,在一个游戏中,智能体的棋子正在被一个敌方棋子追逐并且敌方棋子越来越近,智能体应该知道如果它加速远离敌人,它将获得更好的奖励。

如果游戏环境是动态的呢?

大多数游戏环境都是动态的,因为状态会随着时间而变化。如果你的意思是如果游戏规则本身随着时间而变化,那么这可能会给一些学习算法带来有趣的问题,但不应该改变学习使用影响虚拟世界加速的控件的任何事情。

你甚至可以向人工智能教授数学吗?

一般来说,不,你不能将数学教给那种玩游戏或与现实世界对象交互的系统。这种学习系统还不够先进,无法从交互中学习概念或建立游戏世界逻辑。相反,它们的工作更类似于感知、肌肉记忆以及固有的或习得的反射。例外情况通常会内置一个世界模型(带有必要的方程)或提供给代理,而无需学习任何东西。

但是,有些 AI 系统使用可以处理数学理论的形式逻辑。有些人已经完成了有趣的壮举,例如“发现”素数,给定整数和基本算术的正式定义。这种系统的一个例子是自动数学家

有一种中间可能性:一些学习代理不仅学习某些动作的价值最佳策略,它们还学习预测接下来应该发生的环境状态。这样的代理将包括一个模型,该模型可以观察正在加速的物体并预测它们的未来位置。在某些方面,这一个习得的加速度概念,尽管它不会像牛顿运动定律那样在数学上表示,并且更类似于允许一个人跟踪、预测和接住投出的球的直觉。

诸如遗传编程之类的方法可以从观察中得出符号表达式。事实上,当目标不仅仅是找到一个很好地拟合数据的函数时,这些方法可以用作神经(或其他非符号)方法的替代方法,而且它也有机会对所学知识给出人类可读的描述根据用户选择为学习方法提供的任何数学函数的函数。

这些方法甚至在商业上用于知识发现。