我需要对德语文本进行共指解析,并且我计划使用 OpenNLP 来执行此任务。
据我所知,OpenNLP 共指解析不支持德语。
我需要哪些组件/数据来调整代码,以便可以对德语文本执行共指解析?
我需要对德语文本进行共指解析,并且我计划使用 OpenNLP 来执行此任务。
据我所知,OpenNLP 共指解析不支持德语。
我需要哪些组件/数据来调整代码,以便可以对德语文本执行共指解析?
从旧版本的OpenNLP README:
训练工具
除了 coref 组件之外,所有组件都有培训工具。请查阅工具的帮助信息和 javadoc 以了解如何训练工具。
我们 wiki 中的教程也可能会有所帮助。
以下模块目前支持通过 WordFreak opennlp.plugin v1.4 ( http://wordfreak.sourceforge.net/plugins.html ) 进行培训。
- coreference:org.annotation.opennlp.OpenNlpCoreferenceAnnotator(使用opennlp 1.4.3进行训练,模型兼容)
注意:为了训练模型,您需要所有训练数据。目前没有一种机制可以使用附加数据更新随项目分发的模型。
如您所见,OpenNLP 不提供共指组件的训练工具。但是,似乎有一段时间可以使用第三方 WordFreak 插件为 OpenNLP 的 coref 组件训练新模型......但是,它已经有十多年没有更新了,所以你的里程可能会有所不同。