如何在没有标记数据的情况下进行机器翻译?

人工智能 机器学习 无监督学习 机器翻译 未标记数据集
2021-10-22 19:38:33

是否可以在没有并行双语数据的情况下训练神经网络进行机器翻译?

1个回答

在这篇论文中:使用单语语料库的无监督机器翻译只有 作者提出了一种新方法。

在此处输入图像描述

直观地说,它是一个自动编码器,但“句子开头”标记被设置为语言类型。

另一种高级方法是使用预训练模型。在本文中:跨语言语言模型预训练研究人员提出了一种算法,该算法利用了预训练的多语言训练 BERT(带有标记数据,但我们的任务不需要标记数据集)和前面提到的自动编码器。