从文本中提取日期、关系和名词短语

数据挖掘 nlp 文本挖掘 信息检索 nltk 斯坦福-nlp
2022-02-20 06:22:04

一个句子(从文档中分段)如下:

This Amendment dated 26th of April 2018 modifies the Agreement dated 20th April 2017.
or
This Amendment depends on the agreement dated 20th April 2017

我想将以下内容提取为 CSV

Document_type | Date_of_document | relation | related_doc | related_doc_date
----------------------------------------------------------------------------
Amendment     | 26-04-2018       | modifies | Agreement   | 20-04-2017
Amendment     | Null             | depends  | agreement   | 20-04-2017

到现在为止我做了什么

使用斯坦福 NER 找到并提取日期。以标准化形式获得它们。可以使用 TextBlob 提取名词短语。但不能链接哪个名词短语链接到哪个日期。

我做错了吗?任何教程/示例/建议?

0个回答
没有发现任何回复~