用于定量关系的 NLP 库或例程

数据挖掘 nlp 文本挖掘
2022-02-18 07:29:37

我正在寻找通用方法和库来提取自然语言中概念之间的定量关系。例如

Exam score greater than 90%
Exam scores of 90% or greater

应该提取到类似的结构

Exam Score,>=,90% 

我从一个简单的正则表达式/字典方法开始,但感觉很原始。

1个回答

这取决于您希望您的方法如何“概括”。如果您已经知道并固定了一组定量关系(=、<=、>=、...),那么您可以将其视为分类问题。给定一些输入字符串,它最有可能属于哪个类别?实体也是如此。您是否假设它将始终是两个实体?

如果系统应该处理无限数量的具有未知且可能无限数量的关系的实体,那么问题很快就会变得棘手。

如果您假设总会有两个实体,那么您可以应用资源描述框架 (RDF)RDF 的目标是找到语义实体及其关系。RDF 查找三元组:主语、谓语和宾语。谓语是主客体之间的“数量关系”。有多种框架可以从句子中提取 RDF。最有效的依赖于构建自然语言的解析树。