当我们从用户那里获得新数据或反馈时,我的聊天机器人需要接受培训。有人可以提供这些聊天机器人如何自我学习并每天变得聪明的方法吗?
一些技术可能是:
- 强化学习 - 虽然我找不到成功的实施并提出了一个单独的问题。任何成功的实施参考都会有所帮助。
- 使用用户反馈构建管道 - 这有两个缺点。一位用户或管理员必须提供正确答案。其次,单个反馈数据可能不足以重新训练机器人。
任何专家建议 - 自我优化聊天机器人架构或一些代码参考或一些试图解决这个问题的论文(可能是带有代码的论文)?
当我们从用户那里获得新数据或反馈时,我的聊天机器人需要接受培训。有人可以提供这些聊天机器人如何自我学习并每天变得聪明的方法吗?
一些技术可能是:
任何专家建议 - 自我优化聊天机器人架构或一些代码参考或一些试图解决这个问题的论文(可能是带有代码的论文)?