是否有任何资源详细描述了基于示例的简单机器翻译算法?

人工智能 自然语言处理 参考请求 资源请求 机器翻译
2021-11-10 07:22:46

我正在寻找一种用于构建语言的机器翻译工具。我认为基于示例的方法是最合适的,因为所说的语言非常规则,我可以有足够数量的并行翻译。

我已经知道基于示例的机器翻译 (EBMT) 方法背后的总体理念,但我找不到任何资源来描述可以让我轻松实现它的简单 EBMT 算法(或模型)。

所以,我正在寻找:

  • 详细的描述,
  • 伪代码或
  • 一个足够清晰的开源项目(可能是 GitHub 项目)

一个朴素的EBMT算法。因此,我不是在寻找实现此功能的软件库,而是在寻找能够详细解释/描述幼稚/简单 EBMT 算法的资源,以便我能够实现它。

请注意,EBMT 算法可能有几十种变体。我只是在寻找最天真/最简单的一个。

我已经看过Phrase-based Memory-based Machine Translator项目,但不幸的是,它不仅基于示例,而且还基于统计,即它需要由例如 Giza++ 或 Moses 生成的对齐文件。

1个回答

我没有找到任何简单的 EBMT 系统的简单实现,但我发现了一些可能有帮助的文章、论文和书籍(虽然我没有阅读它们,除了第一篇和最后一篇),所以我将它们列在下面.

网络文章基于示例的机器翻译为基于示例的机器翻译提供了一个不错的高级解释。

Chunyu Kit 等人的论文基于示例的机器翻译:新范式(2002)。似乎还提供了 EBMT 方法的详细描述,因此本文应该为您提供实现 EBMT 系统所需的详细信息。

Makoto Nagao的论文A framework of a framework of a framework of a Japanese and English by analog principle (1984) 介绍了基于示例的机器翻译方法,因此它至少具有历史意义。

此外,巴斯克语的基于示例的机器翻译论文和基于示例的机器翻译的最新进展(2003)一书显然不是在线免费提供的,它们也可能有用。

最后是文章机器翻译。从冷战到深度学习对主要机器翻译方法进行了很好的高级概述,以便您了解 EBMT 与其他方法之间的差异(尤其是在您无法区分 EBMT 和其他 MT 的情况下,例如那些使用平行语料库的方法,例如监督统计机器翻译方法)。