这是哪种 NLP 方法?

数据挖掘 nlp
2022-03-12 03:23:10

我已经搜索了 2 周,但到目前为止我还没有找到。

有一份疾病清单

Diabetes 
Heart Transplant
Fingertip amputation
Injury by sharp tools
.
.
.

我的数据集是医学文本报告的列表。

训练数据集包含可以从每条记录中生成的疾病

我做的例子

这个病人在使用他的雕刻凿子时被割伤并导致失去了指尖,因此我们不得不手术缝合尖端......

从这份报告中,我们得到了这些疾病

1- Injury by sharp tools
2- Fingertip amputation
3- Sewing injury

另一份报告结果可能有3种或更少或更多的疾病

我搜索了很多我发现了很多关于 NLP 分类的例子

其中文本将被分类为体育、政治、文化、科学等。

我发现 NER 可以从文本中提取人名、位置、日期等。

但没有找到任何单个文本可能有多个值(类似于我的数据集)

我不知道从哪里开始。

谁能帮我找到这种从文本中提取问题列表的方法的名称是什么?

编辑

如果报告说,我还需要什么来排除否定

“这个病人有胃病,但不是糖尿病”

我怎样才能让 AI 理解在糖尿病之前有一个否定(NOT)所以不应该包括在内?

所以结果将是

stomach problem

因为糖尿病应该被排除,因为否定词

2个回答

您可能想查看Multi-Label-Classification如果您有足够数量的样本作为训练数据,则可以构建一个模型,该模型可以为一个测试样本预测多个标签。您可以在此处的 sklearn 页面上找到更多关于实现的信息

该任务将非常接近主题建模,通常作为多标签分类问题来处理。