斯坦福 NLP 中的名称标注器

数据挖掘 nlp 斯坦福-nlp
2022-02-15 16:37:18

stanfordNLP 中是否有任何用于名称解析的好库?基本上我想将名字、姓氏、昵称、姓氏、名字与全名分开。类似于 HumanName 和 parserator.tag、parserator.parse 的东西?假设我有一个名字Mr George "Gob" Bluth II,如果我使用 parserator.parse,它会给我下面的输出。斯坦福 NLP 中有这样的东西吗?

>>> probablepeople.parse('Mr George "Gob" Bluth II')  
[('Mr', 'PrefixMarital'), ('George', 'GivenName'), ('"Gob"', 'Nickname'), ('Bluth', 'Surname'), ('II', 'SuffixGenerational')]

谢谢!

1个回答

名称解析似乎没有内置到Stanford CoreNLP中。.

一种选择是使用Stanford TokensRegex编写一系列正则表达式来解析和标记名称标记。

另一种选择是使用第三方包,例如Python 中的nameparser