这方面有一些工作,但有三个聊天机器人。 Xing Han Lu开发了一些名为 Generative Adversarial Bots (GABs) 的代码,它建立在 Ian Goodfellow 发明的 Generative Adversarial Networks 的概念之上。请参阅他的开创性论文“生成对抗网络”。
这里有一个非常简短的 Google 演示文稿。
GAB 的基本思想是“通过在两个机器人之间生成对话并使用图灵测试评估响应来比较对话聊天机器人的性能和人类相似性”。“生成对抗机器人 (GAB) 是相互对抗的机器人,并生成用于训练第三个机器人的对话”。
您可能还想查看Jiwei Li、Will Monroe、Tianlin Shi、Sébastien Jean、Alan Ritter 和 Dan Jurafsky的“神经对话生成的对抗性学习” 。从他们的摘要中:
在本文中,从图灵测试中汲取直觉,我们建议使用对抗性训练来生成开放域对话:训练系统以生成与人类生成的对话话语无法区分的序列。我们将任务视为强化学习 (RL) 问题,我们联合训练两个系统,一个生成模型以产生响应序列,以及一个鉴别器——类似于图灵测试中的人类评估器——以区分人类生成的对话和机器生成的对话。然后将鉴别器的输出用作生成模型的奖励,推动系统生成最类似于人类对话的对话。
作者之一李继伟已在此处发布了代码。