是否有针对法语训练的命名实体重新识别算法?

数据挖掘 分类 nlp 命名实体识别 斯坦福-nlp
2022-02-19 08:31:50

我正在尝试为我的移动应用程序实现一个实用程序,以根据用户问题执行一些操作。我需要一种算法来从文本字符串(法语语法)中提取命名实体。我已经使用nltk了斯坦福 NER 模型的接口,但它仅适用于英语(支持其他语言的子集,但我找不到法语)。我也使用过Polyglot,但它似乎不能很好地完成工作(也许我使用的模型没有经过很好的训练)。我不知道是否有任何免费的 REST API 可以对法语或任何其他算法进行 NER,甚至是已经训练过的nltk/模型Stanford NER

2个回答

是的,有一个免费的法国模型,可以通过 spaCy 包使用!

这是小型和中型型号,应该准备好了

以下是 spaCy 网站上显示的数据集的基本摘要:

法国 spacy 模型细节

我还在使用 Spacy 模型进行法语 NER。您可以重新训练它们以提高结果。

另一方面,谷歌提供了一个api,但根据您要发送的文本量,它可能会变得相当昂贵。