通过反复试验学习的 AI 系统的名称是什么?

人工智能 机器学习 强化学习 术语 增量学习 领域
2021-11-10 17:02:46

想象一个控制复杂通风系统中的阻尼器的系统,其目标是完美平衡每个通风系统的输出。该系统具有用于风门位置、不同位置和每个通风口的流量的传感器。该系统最初是使用相当小的数据集甚至是公式化算法来控制阻尼器来实现的。如果该算法被编程为“尝试”不同配置的风门以优化气流,并在初始(弱)训练或公式的广泛指导下进行呢?该系统将尝试不同的配置并了解哪些改进了结果,哪些结果恶化了,以努力减少错误(差异流出)。

这种人工智能系统叫什么?这种学习系统叫什么?目前是否有系统可以做到这一点?

3个回答

问题定义的近似解决方案是强化学习。您可以使用目标函数定义一些奖励,并为机器定义一些可能的状态空间,最后通过强化学习技术解决问题(通过学习偏好来接近试错)。

我相信“强化学习”是您正在寻找的术语(正如其他人所提到的),但请记住,您的问题的范围属于称为Search的 AI 部分。

搜索算法基于尝试不同的动作(决策)并在给定当前和过去的问题状态的情况下选择最小化任意成本函数(奖励)的动作。

我认为任何学习算法都可能使用反复试验和结果分析,最终目标是最大化效用。

似乎人工智能最近的里程碑属于机器学习的一般范畴,包括所有形式的强化学习本质上,任何学习算法都在使用某种形式的统计分析。

  • 对于一个概括性术语,我一直在使用“学习算法”

然而,自组织网络等能力较弱的自适应系统也有着悠久的历史(另见最优控制。)