我被告知 5 个 java NLP 库。
- 阿帕奇 cTAKES™
- 元地图
- LexEVS ( http://lexsrv3.nlm.nih.gov/LexSysGroup/Projects/lvg/current/web/download.html )
- Apache OpenNLP
我还计划通过 map-reduce 和 hadoop 并行化 NLP 库。但是,我是自然语言处理的新手,所以我不知道如何解决这个问题。
目标是从 www.clinicaltrials.gov 下载一组关于癌症的临床试验并解析资格标准(纳入和排除标准),识别 ECOG 分数并用允许的 ECOG 分数注释每个 CTA。
例如,在以下文件中,如果纳入标准中指定了 ECOG,则不否定。如果排除标准中指定了ECOG,则否定。如果排除标准和纳入标准均未提及,则不否定 ECOG。
文档:
CTA“NCT01572038”的资格标准
纳入标准:
- 患者必须有原发性非小细胞肺癌的组织学证据(表现为离散的孤立性放射学肿块或结节的支气管肺泡癌符合条件)
- 患者必须在术后根据病理标准分为 IB、II 或 IIIA 期
- 切除时应尝试完整的纵隔淋巴结切除或至少淋巴结取样;如果未进行完整的纵隔淋巴结切除术或淋巴结取样,则在术前计算机断层扫描 (CT)/磁共振成像 (MRI) 扫描中测量到 1.5 厘米或以上的任何纵隔淋巴结或任何增加摄取的区域术前正电子发射断层扫描 (PET) 扫描中的纵隔必须经过活检;注意:术前 PET 扫描不是强制性的
- 淋巴结组织必须按照美国胸科学会的建议进行标记;鼓励外科医生对所有可触及的淋巴结水平进行解剖或取样;活检的理想水平是:
- 右上叶:4、7、10
- 右中叶:4、7、10
- 右下叶:4、7、9、10
- 左上叶:5、6、7、10
- 左下叶:7、9、10
- 手术可能包括肺叶切除术、袖状切除术、双叶切除术或全肺切除术,由主治外科医生根据术中发现确定;仅进行了节段切除术或楔形切除术的患者不符合本研究的条件;手术结束时必须切除所有严重疾病;所有手术切缘必须为肿瘤阴性
- 手术和随机化之间的间隔不得超过 16 周;对于接受术后辅助铂类化疗的患者,手术和随机化之间的间隔可能不超过 26 周
- 患者必须同意提供并且研究者必须同意应中央肿瘤库的要求提交具有代表性的福尔马林固定石蜡块肿瘤组织,以便可以进行特定的 EGFR 相关标志物测定
- 患者的东部肿瘤协作组 (ECOG) 体能状态必须为 0、1 或 2
- 白细胞 >= 3.0 x 10^9/L 或 >= 3000/ul
- 绝对粒细胞计数 >= 1.5 x 10^9/L 或 >= 1,500/ul
- 血小板 >= 100 x 10^9/L 或 >= 100,000/ul
- 正常机构范围内的总胆红素
- 碱性磷酸酶 =< 2.5 x 机构正常上限;如果碱性磷酸酶高于机构正常上限 (UNL) 但低于允许的最大值,则必须在随机分组前进行腹部(包括肝脏)超声、CT 或 MRI 扫描和放射性核素骨扫描以排除转移性疾病; 如果值大于允许的最大值,则无论任何补充成像结果如何,患者都将不被视为合格
- 天冬氨酸氨基转移酶 (AST) (血清谷草酰乙酸转氨酶 [SGOT]) 和/或丙氨酸氨基转移酶 (ALT) (血清谷氨酸丙酮酸转氨酶 [SGPT]) =< 2.5 x 机构正常上限;如果 AST (SGOT) 或 ALT (SGPT) 大于机构正常上限 (UNL) 但小于允许的最大值,则必须在随机化之前进行腹部(包括肝脏)超声、CT 或 MRI 扫描以排除转移性疾病; 如果值大于允许的最大值,则无论任何补充成像结果如何,患者都将不被视为合格
- 患者必须在随机分组前 14 天内进行胸部 X 光检查;如果进行了以下至少一项,则患者必须在手术切除前 90 天内进行胸部 CT 或 MRI 扫描:
- 完整的纵隔淋巴结切除术;或者
- 对所有所需水平的淋巴结进行活检 - 如上所述;或者
- 手术切除前 60 天内进行术前 PET 扫描 如果未进行上述任何一项,则必须在手术切除前 60 天内进行胸部 CT 或 MRI 扫描 注意:术前 PET 扫描不强制的
- 患者必须在随机分组前 14 天内完成心电图 (EKG)
- 育龄妇女和男性必须同意在进入研究之前和服用研究药物期间以及最终剂量后的三个月内使用适当的避孕措施(激素或屏障避孕方法);如果一名女性在她或她的男性伴侣参与本研究期间怀孕或怀疑自己怀孕,她应立即通知她的主治医生
- 患者可以接受术后放射治疗;患者必须在随机分组前至少 3 周完成放疗,并且已从所有放疗引起的毒性中恢复;接受过放射治疗的患者也应在手术后 16 周内随机分组
- 必须根据当地机构和/或大学人体实验委员会的要求获得患者同意;当地参与调查人员有责任获得必要的当地许可,并以书面形式向加拿大国家癌症研究所 (NCIC) 临床试验组 (CTG) 研究协调员(NCIC CTG 中心)或癌症试验支持单位 (CTSU)(适用于所有其他研究人员),在该中心开始试验之前已获得此类许可;不会提供标准的试验同意书,但会提供样本表;此样本同意书已获得美国国家癌症研究所 (NCI) 中央机构审查委员会 (IRB) 的批准,并且必须由在 CIRB 授权下运营的 CTSI 中心原样使用;对于 NCIC CTG 中心,必须将初始全委员会研究伦理委员会 (REB) 批准和批准的同意书的副本发送至 NCIC CTG 中心办公室;请注意,本研究的同意书必须包含允许政府机构、NCI、NCIC CTG 和监测机构审查患者记录的声明
- NCIC-CTG中心:患者必须有能力理解并愿意签署书面知情同意书;患者必须在随机分组前签署同意书
- CTSU 中心:患者,或在精神上无行为能力的患者的情况下,其合法授权和合格的代表,必须有能力理解并愿意签署书面知情同意书;同意书必须在随机化之前签署
- 患者必须能够接受治疗和随访;研究人员必须向自己保证,在该试验中注册的患者将可获得有关治疗、毒性和随访的完整文件
- 方案治疗的启动必须在患者随机分组后的 10 个工作日内开始
- 患者可能已接受术后辅助铂类化疗;患者必须在随机分组前至少 3 周完成化疗,并且已从所有化疗引起的毒性中恢复;接受辅助化疗的患者也应在手术后 26 周内随机分组
排除标准:
- 既往或并发恶性肿瘤;先前诊断为癌症的患者,如果他们在治疗结束后五年或更长时间没有复发和转移,并且治疗医师认为先前的恶性肿瘤不存在复发的实质性风险,则为有资格参加研究;接受过非黑色素瘤性皮肤癌或宫颈原位癌充分治疗的患者符合条件,无论何时给予该治疗
- 小细胞癌和非小细胞癌的组合或肺类癌
- 多个明显的原发癌离散区域(即使在同一肺叶内,T4,IIIB)
- 具有临床意义或未经治疗的眼科疾病(如干燥症等)或胃肠道疾病(如克罗恩病、溃疡性结肠炎)
- 任何会使方案治疗变得危险的活动性病理状况,例如:不受控制的充血性心力衰竭、心绞痛或心律失常、活动性不受控制的感染或其他
- 有精神或神经系统疾病史,这会使获得知情同意有问题或会限制对研究要求的遵守
- 患者(如果是女性)怀孕或哺乳
- NSCLC的新辅助化疗或免疫治疗;然而,患者可能在术前接受了有限野、低剂量(小于 1000 cGy)外照射或支气管内近距离放射治疗或激光治疗,以短期控制咯血或脑叶阻塞;具有治愈目的的全剂量术前放疗是排除的原因;患者可能已接受术后辅助铂类化疗,但非铂类化疗是排除的原因
- 归因于与本试验中使用的药物具有相似化学或生物成分的化合物的过敏反应史;排除持续使用苯妥英、卡马西平、巴比妥类药物、利福平或圣约翰草的患者
- 以前的肿瘤或其他大手术的不完全愈合
我想查找具有如下查询的文档。
输入
“东部肿瘤协作组 (ECOG) 体能状况 > 2 的患者”将被排除在外
输出
CTA: NCT01572038
Labels: ECOG 0, ECOG 1, ECOG 2
解决这个问题的最简单方法是什么?