OpenNLP 共指解析(德语)

数据挖掘 nlp 文本挖掘
2021-09-15 20:58:58

我需要对德语文本进行共指解析,并且我计划使用 OpenNLP 来执行此任务。

据我所知,OpenNLP 共指解析不支持德语。

我需要哪些组件/数据来调整代码,以便可以对德语文本执行共指解析?

1个回答

从旧版本的OpenNLP README

训练工具

除了 coref 组件之外,所有组件都有培训工具。请查阅工具的帮助信息和 javadoc 以了解如何训练工具。

我们 wiki 中的教程也可能会有所帮助。

以下模块目前支持通过 WordFreak opennlp.plugin v1.4 ( http://wordfreak.sourceforge.net/plugins.html ) 进行培训。

  • coreference:org.annotation.opennlp.OpenNlpCoreferenceAnnotator(使用opennlp 1.4.3进行训练,模型兼容)

注意:为了训练模型,您需要所有训练数据。目前没有一种机制可以使用附加数据更新随项目分发的模型。

如您所见,OpenNLP 不提供共指组件的训练工具。但是,似乎有一段时间可以使用第三方 WordFreak 插件为 OpenNLP 的 coref 组件训练新模型......但是,它已经有十多年没有更新了,所以你的里程可能会有所不同。