通过词性标注,可以假设给定句子的单词是noun
/verb
等,但如果句子是例如:
"My favourite book is harry potter and the prizoner of azkaban"
请注意,我收到的输入将来自聊天界面,因此无法期望数据具有固定格式。有没有办法"harry potter and the prizoner of azkaban"
从此类消息中识别为专有名词?
目前此查询标记为:
My|PRP$
favourite|JJ
book|NN
is|VBZ
harry|JJ
potter|NN
and|CC
the|DT
prizoner|NN
of|IN
azkaban|NN
我想知道这是否可以通过某种方式处理,或者是否有另一种算法可以处理这个问题?