学习代理和其他类型的代理有什么区别?
可以通过哪些方式应用学习代理?学习代理与深度学习有什么不同吗?
学习代理和其他类型的代理有什么区别?
可以通过哪些方式应用学习代理?学习代理与深度学习有什么不同吗?
学习代理和非学习代理之间的主要区别在于,学习代理可以自行提高其性能,使其变得“更聪明”。
Russel & Norvig 在他们的教科书《人工智能:现代方法》中详细介绍了不同类型的智能代理,智能代理的维基百科条目反映了它们的定义。[这里是第 3 版的免费 pdf。]
他们将代理分为以下几类:
因为需要理解技术术语,所以我不打算深入,但上面列表中的链接提供了简单的流程图解释。
在前 4 个中,更复杂的代理包含原始代理。基于模型的代理实际上是一种“基于模型的反射代理”,目标代理和效用代理也是基于模型的。
你会注意到,随着学习代理的结构发生了根本性的变化。
学习代理的关键组件分为“批评者”、“学习元素”、“性能元素”和“问题生成器”。这种结构允许代理评估过去的表现并修改后续行动以提高表现(学习)。问题生成器允许代理寻求新的策略(实验)。
简单反射代理在“条件-动作规则”下运行(如果满足条件,则采取此动作),学习型代理可以改进其初始编程之外的决策。
深度学习是一种使用表示的机器学习形式。在最一般的意义上,算法使用试错法和统计分析来优化性能。各种形式的神经网络被归类为深度学习系统。[另请参阅深度强化学习与强化学习。]
我的感觉是,学习代理可以应用于可以充分定义参数的任何类型的问题。我不想说得太具体,因为学习算法有很多种,但自 2016 年以来,我们已经看到机器学习的应用(以各种形式)显着扩展。这包括取代传统的控制系统、医疗诊断、自然语言处理、图像识别和消费者推荐。
这些应用程序最初是“狭窄的”,被定义为单个任务的能力,但可以针对涉及离散问题集的自动导航车辆等任务进行聚合。
学习代理是具有问题生成器、学习元素、批评者和性能元素的代理。ProbGen 只是针对域和管辖范围内的一组参数创建问题的不同实例。学习元素负责做出有效的选择,而性能元素为所选选择选择动作。它还改变了一些知识库。评论家基本上是一个衡量标准,用于判断哪个是更好的选择。
深度学习比这要复杂一些。再说一次,让我们简化一下。你看,深度学习是神经网络的一种特定排列或子部分,可以帮助学习代理更快地学习。这就像我能解释的那样简单。我们所做的是我们有目的地安排神经网络中的层并将其密集打包以使其更加特定于任务。显然,我遗漏了很多实现细节,但对于他们,恐怕你需要查阅教程。
它们在人工智能中是如何使用的?那是具体问题。学习代理无处不在,从垃圾邮件检测到roombas,再到人造狗宠物。另一方面,深度学习目前专注于各个方面的用户模式识别和个性化。如果您需要我扩展此答案,请告诉我。