想象一个控制复杂通风系统中的阻尼器的系统,其目标是完美平衡每个通风系统的输出。该系统具有用于风门位置、不同位置和每个通风口的流量的传感器。该系统最初是使用相当小的数据集甚至是公式化算法来控制阻尼器来实现的。如果该算法被编程为“尝试”不同配置的风门以优化气流,并在初始(弱)训练或公式的广泛指导下进行呢?该系统将尝试不同的配置并了解哪些改进了结果,哪些结果恶化了,以努力减少错误(差异流出)。
这种人工智能系统叫什么?这种学习系统叫什么?目前是否有系统可以做到这一点?
想象一个控制复杂通风系统中的阻尼器的系统,其目标是完美平衡每个通风系统的输出。该系统具有用于风门位置、不同位置和每个通风口的流量的传感器。该系统最初是使用相当小的数据集甚至是公式化算法来控制阻尼器来实现的。如果该算法被编程为“尝试”不同配置的风门以优化气流,并在初始(弱)训练或公式的广泛指导下进行呢?该系统将尝试不同的配置并了解哪些改进了结果,哪些结果恶化了,以努力减少错误(差异流出)。
这种人工智能系统叫什么?这种学习系统叫什么?目前是否有系统可以做到这一点?
问题定义的近似解决方案是强化学习。您可以使用目标函数定义一些奖励,并为机器定义一些可能的状态空间,最后通过强化学习技术解决问题(通过学习偏好来接近试错)。
我相信“强化学习”是您正在寻找的术语(正如其他人所提到的),但请记住,您的问题的范围属于称为Search的 AI 部分。
搜索算法基于尝试不同的动作(决策)并在给定当前和过去的问题状态的情况下选择最小化任意成本函数(奖励)的动作。