如何扩展列表?

数据挖掘 nlp
2022-02-20 23:53:49

在列表中,主要名词通常只在末尾提到。但是,对于例如 NER 任务,我想“扩展”它们:

  • 去程和回程 -> 去程和回程
  • 长鼻、黑长尾猴和金丝猴 -> 长鼻猴、黑长尾猴和金丝猴
  • 数学或物理教育 -> 数学教育或物理教育

是否已经有工具(支持德语的奖励积分)?谷歌只会让我扩大收缩(“我已经”->“我有”)......

1个回答

一般来说,这与句法分析有关:需要获得名词短语的解析树,然后可以通过将短语的头部映射到连词的不同部分来进行扩展。

我认为您可以找到德语的依赖解析器,例如在NLTK 库Spacy中。

我不知道您是否会找到一个提供精确扩展的库,但我希望从解析树中可以进行一些编程。