我正在学习命名实体识别并浏览与此类似的帖子:
使用 Keras 双向 LSTM 的命名实体识别 (NER)
因此,句子作为整数序列输入模型 - 每个 int 对应于词汇表中的索引 - 据我了解,这就是嵌入层的工作方式。
我的问题是 - 这是否意味着如果词汇表中不存在一个人的名字,该模型将无法识别它?
例如,从句子中:
“John Doe 去散步了”
鉴于 John Doe 在词汇表中,它将被识别为人名,但句子:
“不知名的名字去散步了”
如果未知名称不在词汇中,将不会被正确标记?
对我来说,这有点奇怪,因为 Unknown Name 与 John Doe 处于相同的上下文中,所以我希望能够以某种方式正确标记它。
我显然在这里缺乏知识,所以我非常感谢任何建议和参考资料。