我想构建一个聊天机器人,主要是基于德语的 BERT(Transformer)。但是我没有找到任何德国聊天机器人数据集!
那么使用谷歌翻译 API 将英语数据集翻译成德语,然后在其上训练模型是否有意义?
知道在哪里可以找到德语数据集或解决此问题吗?
我想构建一个聊天机器人,主要是基于德语的 BERT(Transformer)。但是我没有找到任何德国聊天机器人数据集!
那么使用谷歌翻译 API 将英语数据集翻译成德语,然后在其上训练模型是否有意义?
知道在哪里可以找到德语数据集或解决此问题吗?
首先从聊天机器人开始,您要决定您要构建哪种类型的聊天机器人。
两者都需要不同的方法来解决问题。
下单机器人需要多个模型来完成不同的任务,例如意图识别、命名实体识别、状态机。
聊天机器人只需要 2 人对话数据集,可在 kaggle.com 上轻松获得
但是,如果您正在寻找特定的语言数据集,那么在这两种类型的机器人中都很难找到它。为此,您可以使用任何付费的翻译 api,或者使用网络抓取技术免费完成相同的任务。