在列表中,主要名词通常只在末尾提到。但是,对于例如 NER 任务,我想“扩展”它们:
是否已经有工具(支持德语的奖励积分)?谷歌只会让我扩大收缩(“我已经”->“我有”)......
一般来说,这与句法分析有关:需要获得名词短语的解析树,然后可以通过将短语的头部映射到连词的不同部分来进行扩展。
我认为您可以找到德语的依赖解析器,例如在NLTK 库或Spacy中。
我不知道您是否会找到一个提供精确扩展的库,但我希望从解析树中可以进行一些编程。