我已经搜索了 2 周,但到目前为止我还没有找到。
有一份疾病清单
Diabetes
Heart Transplant
Fingertip amputation
Injury by sharp tools
.
.
.
我的数据集是医学文本报告的列表。
训练数据集包含可以从每条记录中生成的疾病
我做的例子
这个病人在使用他的雕刻凿子时被割伤并导致失去了指尖,因此我们不得不手术缝合尖端......
从这份报告中,我们得到了这些疾病
1- Injury by sharp tools
2- Fingertip amputation
3- Sewing injury
另一份报告结果可能有3种或更少或更多的疾病
我搜索了很多我发现了很多关于 NLP 分类的例子
其中文本将被分类为体育、政治、文化、科学等。
我发现 NER 可以从文本中提取人名、位置、日期等。
但没有找到任何单个文本可能有多个值(类似于我的数据集)
我不知道从哪里开始。
谁能帮我找到这种从文本中提取问题列表的方法的名称是什么?
编辑
如果报告说,我还需要什么来排除否定
“这个病人有胃病,但不是糖尿病”
我怎样才能让 AI 理解在糖尿病之前有一个否定(NOT)所以不应该包括在内?
所以结果将是
stomach problem
因为糖尿病应该被排除,因为否定词