假设我们有一个包含键值实体的自由文本。
示例:“……患者的肿瘤宽6 厘米,高 5 厘米”
然后一位专家来了,将其标记为重要,因此我们确实有在新的不同文本中找到相同实体的规则。
产生通用规则的 NLP 技术的名称是什么,以便我们也能够识别具有相同含义的同义词/变体?
示例:“...患者癌变,60 x 50 mm ”
我需要学习术语才能搜索论文。如果您还可以添加一些对最先进方法的引用,那就太好了。
假设我们有一个包含键值实体的自由文本。
示例:“……患者的肿瘤宽6 厘米,高 5 厘米”
然后一位专家来了,将其标记为重要,因此我们确实有在新的不同文本中找到相同实体的规则。
产生通用规则的 NLP 技术的名称是什么,以便我们也能够识别具有相同含义的同义词/变体?
示例:“...患者癌变,60 x 50 mm ”
我需要学习术语才能搜索论文。如果您还可以添加一些对最先进方法的引用,那就太好了。
您有很多选择,具体取决于您可能拥有的复杂程度和创造力。其中,我建议通过“自然语言理解”技术。
不是那么精确但实际上可以这么说,NLP 是关于处理文本并将每个标记/单词/短语作为一个对象,并根据这些对象的外观学习不同的模型并回答不同的问题。在这里,您并没有真正理解它们的含义。即使您进行情绪分析(这似乎是一个语义概念),您真正要做的也是计算标记并在训练数据中查看它们的标签并预测新标记的情绪。
在 NLU 中,你主要处理词之间的语义、意义和关系。例如,想象一个 Google 搜索查询。当我搜索“上次意大利赢得世界杯时,美国总统是谁?” . 如果 Google 想根据 NLP 对我的页面进行排名,那么可能会出现很多事情,包括这些词及其关闭词(这当然有助于我在相关网页中找到答案)。但是如果谷歌需要提供准确的答案(这仍然不容易!),它需要理解我所说的,因为你在这里看到一个例子。为此,他们使用了一个知识库(对于 Google,它被称为Knowledge Graph),这是我对您问题的回答。
如果有足够的文本,您可以为您的语料库建立一个知识库。为此,您可以手动提取所需短语的模式,并通过此模式搜索您所需句子的所有出现(例如“|MEDICINE| 用于 |DISEASE|”)和所需对象的所有出现(例如“Tumor”)。赫斯特模式可用于您在本文中看到的目的。然后通过图表连接事物,您可以选择了解类似模式正在发生。对于同义词和相关词,您可以轻松使用现有的大量知识库。
希望能帮助到你 :)