如何使用 NLP 和深度学习从原始的非结构化文本中提取特定信息?

数据挖掘 深度学习 nlp 命名实体识别
2022-02-19 15:45:59

我有来自不同来源的数据,它们具有类似的信息,例如下面的示例,其中不同来源想要指定年龄标准。是否有基于 NLP 或深度学习的方法,我可以使用它从原始非结构化文本中提取年龄规则,如下所示。

A Criteria
Applicants should be above 21 years of age and up to 65 years or less at the time of maturity.

B Criteria
You are between 25-58 years of age.

C Criteria
Age of the all applicants should be between 21 and 65 .


A Rule
age >=21 AND age <= 65

B Rule
age >=25 AND age <= 58

C Rule
age >=21 AND age <= 65
1个回答

您可以通过像 Spacy 这样的预训练模型创建自己的命名实体识别。https://spacy.io/usage/linguistic-features#section-named-entities

您示例中的这些关键字应被视为年龄实体

 above 21 years
 65 years or less

试着发挥它的语言特性来得到你所需要的。希望这可以帮助。