两个聊天机器人 - 一个教另一个

人工智能 自然语言处理 聊天机器人
2021-10-30 13:27:07

我正在寻找这种聊天机器人架构的信息:有两个聊天机器人。一个扮演老师的角色,另一个是正在学习的学生。目的是检验学生的素质,提高学生的能力。

我没有找到太多参考。有 :

Bottester:使用模拟用户测试对话系统

ParlAI一个基于 python 的平台,用于启用对话 AI 研究,具有“教师代理”的概念,这似乎是我正在寻找的。

当然,我们也有可能相关的深度强化学习。

对于这种聊天机器人方法,我更喜欢有一些经典参考。目前,强化学习不在我的考虑范围之内。

构建两个互相交谈的聊天机器人,就像 Facebook 所做的那样,并不是我想要的。因为在这种情况下,他们都是学生代理。

2个回答

隐藏议程用户模拟模型 (Schatzmann/Young)描述了一种聊天机器人训练设计,其中用户模拟器组装并执行对话议程,直接目标是训练目标聊天机器人。

也许您可以通过将用户模拟器作为老师来添加此设计的特殊性,并创建一个议程,将信息传达给(学生)聊天机器人。预期的训练行为可能是对教师主题提问的正确回答。

这方面有一些工作,但有三个聊天机器人。 Xing Han Lu开发了一些名为 Generative Adversarial Bots (GABs) 的代码,它建立在 Ian Goodfellow 发明的 Generative Adversarial Networks 的概念之上请参阅他的开创性论文“生成对抗网络”

这里有一个非常简短的 Google 演示文稿

GAB 的基本思想是“通过在两个机器人之间生成对话并使用图灵测试评估响应来比较对话聊天机器人的性能和人类相似性”。“生成对抗机器人 (GAB) 是相互对抗的机器人,并生成用于训练第三个机器人的对话”。

您可能还想查看Jiwei Li、Will Monroe、Tianlin Shi、Sébastien Jean、Alan Ritter 和 Dan Jurafsky的“神经对话生成的对抗性学习” 。从他们的摘要中:

在本文中,从图灵测试中汲取直觉,我们建议使用对抗性训练来生成开放域对话:训练系统以生成与人类生成的对话话语无法区分的序列。我们将任务视为强化学习 (RL) 问题,我们联合训练两个系统,一个生成模型以产生响应序列,以及一个鉴别器——类似于图灵测试中的人类评估器——以区分人类生成的对话和机器生成的对话。然后将鉴别器的输出用作生成模型的奖励,推动系统生成最类似于人类对话的对话。

作者之一李继伟已在此处发布了代码。