数据挖掘 - Twitter数据上的NER - 吾爱随笔录

从 Twitter 数据中提取命名实体 [名称和位置] 的最佳方法/库/数据是什么？[字典查找除外]

我尝试使用 Python-Stanford NER，但是当命名实体没有大写时，它似乎失败了。

在将文本转换为大写后，我还尝试预测 NER，例如：

 text = "david beckham played for england"

 stanford.NERTagger.tag(text)
 [(u'david', u'PERSON'), (u'beckham', u'PERSON'), (u'played', u'O'), (u'for', u'O'), (u'england', u'O')]

 stanford.NERTagger.tag(text.upper())
 output : [(u'DAVID', u'PERSON'), (u'BECKHAM', u'PERSON'), (u'PLAYED', u'O'), (u'FOR', u'O'), (u'ENGLAND', u'LOCATION')]