我正在寻找一种用于构建语言的机器翻译工具。我认为基于示例的方法是最合适的,因为所说的语言非常规则,我可以有足够数量的并行翻译。
我已经知道基于示例的机器翻译 (EBMT) 方法背后的总体理念,但我找不到任何资源来描述可以让我轻松实现它的简单 EBMT 算法(或模型)。
所以,我正在寻找:
- 详细的描述,
- 伪代码或
- 一个足够清晰的开源项目(可能是 GitHub 项目)
一个朴素的EBMT算法。因此,我不是在寻找实现此功能的软件库,而是在寻找能够详细解释/描述幼稚/简单 EBMT 算法的资源,以便我能够实现它。
请注意,EBMT 算法可能有几十种变体。我只是在寻找最天真/最简单的一个。
我已经看过Phrase-based Memory-based Machine Translator项目,但不幸的是,它不仅基于示例,而且还基于统计,即它需要由例如 Giza++ 或 Moses 生成的对齐文件。