德语聊天机器人或会话 AI

数据挖掘 数据集 nlp 伯特 变压器
2022-02-05 19:14:43

我想构建一个聊天机器人,主要是基于德语的 BERT(Transformer)。但是我没有找到任何德国聊天机器人数据集!

那么使用谷歌翻译 API 将英语数据集翻译成德语,然后在其上训练模型是否有意义?

知道在哪里可以找到德语数据集或解决此问题吗?

1个回答

首先从聊天机器人开始,您要决定您要构建哪种类型的聊天机器人。

  1. 下单机器人
  2. 聊天机器人

两者都需要不同的方法来解决问题。

下单机器人需要多个模型来完成不同的任务,例如意图识别、命名实体识别、状态机。

聊天机器人只需要 2 人对话数据集,可在 kaggle.com 上轻松获得

但是,如果您正在寻找特定的语言数据集,那么在这两种类型的机器人中都很难找到它。为此,您可以使用任何付费的翻译 api,或者使用网络抓取技术免费完成相同的任务。