从问题中识别主语和宾语的常用方法是什么?

数据挖掘 机器学习 nlp
2022-03-14 02:27:10

我正在寻找一种从法语问题中提取潜在主语和宾语的方法。

目前,我正在制定一些手工规则。或者,我开始考虑使用已经训练好的模型来完成这项任务。我想使用 StanfordNLP 解析器,但不幸的是它不能免费用于商业用途。

那么,问题来了:

  1. 它们是用于此任务的 ML 模型吗?

  2. 他们是否标记了数据集(法语),可以帮助创建用于此任务的 ML 模型?

[编辑] 我主要寻找开源工具/库。

1个回答

Google SyntaxNe 有针对法语的预训练模型。它是开源的,可以针对特定的用例进行定制。

https://github.com/tensorflow/models/blob/master/research/syntaxnet/g3doc/universal.md

有了这个,您可以为问题创建一个依赖树并评估此应用程序的适用性。