我正在研究一篇关于命名实体识别的论文。以下是摘要的一部分:
为了评估 NER 系统的稳健性,我们提出了一种评估方法,该方法侧重于代表特定错误来源的标记子集:未知单词和标签偏移或歧义。
我不知道“标签转移”的定义是什么。该论文没有解释它,我无法通过谷歌搜索找到任何我能理解的东西。
我正在研究一篇关于命名实体识别的论文。以下是摘要的一部分:
为了评估 NER 系统的稳健性,我们提出了一种评估方法,该方法侧重于代表特定错误来源的标记子集:未知单词和标签偏移或歧义。
我不知道“标签转移”的定义是什么。该论文没有解释它,我无法通过谷歌搜索找到任何我能理解的东西。
标签移位与协变量移位相反。
在这种情况下,假设即使特征分布保持不变,标签分布也可能会发生变化。
例如症状 --> 疾病
不同国家可能不同(基于国家/医生的医学教育)
它也可能随着时间变化,也基于医学知识的进步
可以为“单词 --> 俚语”构建类似的逻辑。由于接受了这些词,它会随着时间而改变。
阅读参考资料以获得正式的解释。
参考资料
-
深入学习
使用黑盒预测器检测和纠正标签移位