是否可以在没有并行双语数据的情况下训练神经网络进行机器翻译?
如何在没有标记数据的情况下进行机器翻译?
人工智能
机器学习
无监督学习
机器翻译
未标记数据集
2021-10-22 19:38:33
1个回答
在这篇论文中:使用单语语料库的无监督机器翻译只有 作者提出了一种新方法。
直观地说,它是一个自动编码器,但“句子开头”标记被设置为语言类型。
另一种高级方法是使用预训练模型。在本文中:跨语言语言模型预训练研究人员提出了一种算法,该算法利用了预训练的多语言训练 BERT(带有标记数据,但我们的任务不需要标记数据集)和前面提到的自动编码器。