从 Twitter 数据中提取命名实体 [名称和位置] 的最佳方法/库/数据是什么?[字典查找除外]
我尝试使用 Python-Stanford NER,但是当命名实体没有大写时,它似乎失败了。
在将文本转换为大写后,我还尝试预测 NER,例如:
text = "david beckham played for england"
stanford.NERTagger.tag(text)
[(u'david', u'PERSON'), (u'beckham', u'PERSON'), (u'played', u'O'), (u'for', u'O'), (u'england', u'O')]
stanford.NERTagger.tag(text.upper())
output : [(u'DAVID', u'PERSON'), (u'BECKHAM', u'PERSON'), (u'PLAYED', u'O'), (u'FOR', u'O'), (u'ENGLAND', u'LOCATION')]