我正在尝试使用 NLTK 库从患者的医疗报告中提取表示医疗症状的关键字。例如,我有一份医疗报告如下:
s:一位 33 岁的女性晶体学家出现轻度眩晕、轻度头痛,特别是在后脑勺和早晨 x 2 周。pt 还报告慢性轻度偶尔头晕。o:身高 160 厘米,体重 53.8 公斤,体温 37.3 摄氏度,脉搏 76,收缩压 146,舒张压 93,呼吸 15,心脏 = 心脏底部 2/6 的收缩期杂音,胸部 = 听诊清晰 B/L,无罗音或喘息,四肢 = 无水肿或杵状指,心脏 = 正常 S1、S2、RRR a:高血压 p:执行 E/M 2 级(确定的患者) - 已完成,并开具了氢氯噻嗪 - 50 mg po qd,并订购了胆固醇。
在这里,我想找到所有代表医学症状的关键字或二元组。在上面的文字中,这些关键词是“轻度眩晕”、“轻度头痛”、“头晕目眩”等。
为此,我需要某种代表症状的术语集合,以便我可以在我拥有的医疗报告中检测到类似的术语。是否有任何与医学术语相关的 NLTK 语料库?如果我找到表示医学症状的单词列表,我可以对我在医学报告中检测到的单词进行标记和词形还原,并将它们与语料库中的单词进行比较。
谢谢你。