我是命名实体识别的新手。我需要从语料库中提取一些特定数据。
两个语料库示例:
嗨,Rajesh Das 想买这辆车。Rakesh Das 将使用这辆车。
嗨,Rakesh Das 是 Rajesh Das 的兄弟。Rajesh Das 会买这辆车。
从上面的这些示例中,我需要提取买家姓名。所以很明显,靠近购买字的名字将是买家的名字。对于两个语料库,Rajesh Das 的位置是不同的。我无法弄清楚提取买家姓名需要实施哪种算法。
我关注了实现 SpaCy 和 NLTK的https://towardsdatascience.com/named-entity-recognition-with-nltk-and-spacy-8c4a7d88e7da帖子。它只提供所有名单。有人可以告诉我如何获得买家姓名吗?