我正在使用 NLTK 包装器测试 StanfordNERTagger 并出现此警告:
DeprecationWarning: The StanfordTokenizer will be deprecated in version
3.2.5. Please use nltk.tag.corenlp.CoreNLPPOSTagger or
nltk.tag.corenlp.CoreNLPNERTagger instead.
super(StanfordNERTagger, self).__init__(*args, **kwargs)
我的代码如下所示:
from nltk import word_tokenize, pos_tag, ne_chunk
from nltk.tag import StanfordNERTagger
sentence = "Today George went to school and met his friend Peter."
# stanford's NER tagger 3 entity classification
st = StanfordNERTagger('/home/hercules/Desktop/PhD/Tools/stanford-ner-
2017-06-09/classifiers/english.all.3class.distsim.crf.ser.gz',
'/home/hercules/Desktop/PhD/Tools/stanford-ner-2017-06-09/stanford-
ner.jar',
encoding='utf-8')
tokenized_text = word_tokenize(sentence)
classified_text = st.tag(tokenized_text)
print("Stanford NER tagger:")
print(classified_text)
我尝试使用 CoreNLPNERTagger,但找不到任何示例或文档。我只找到了这个链接: 它在 CoreNLPNERTagger(CoreNLPTagger) 类的评论中给出了一个类似例子的例子(我通过搜索关键字“CoreNLPNERTagge”找到了它)
我试图效仿这个例子,但没有用。我想我应该首先启动(如果这是正确的术语)coreNLP 服务器,但如果是这种情况,我不知道该怎么做。
如果有人有任何想法或建议,我将不胜感激。
