我应该如何选择预测疾病的特征(特别是当患者明确他们的健康问题时)?

人工智能 机器学习 数据集 预言 特征选择 卫生保健
2021-11-08 15:19:02

我的目标是训练一个预测疾病的模型。现在,根据这篇维基百科文章,疾病通常根据以下标准进行分类:

  • 原因(疾病)
  • 发病机制(疾病进展的机制)
  • 年龄
  • 性别
  • 症状(疾病)
  • 损害(由疾病引起)
  • 器官类型(如心脏病、肝病等)

这些特征是否普遍用于预测疾病(即所有类型的疾病)?我不这么认为。也可以有其他属性。例如,在冠状病毒的情况下旅行。

那么,有没有更好的预测疾病的特征呢?或者当患者说明他们的健康问题时,其中哪些比其他更好?

2个回答

因此,对于医学预后,通常会出现一些变量,例如年龄、性别、腹水、肝、蜘蛛、疾病状态等,但这取决于疾病。如果您进行回归分类,您通常会遇到这些变量。

此外,如果您正在阅读 Radiology Reports 以获取模型的输入,那么您还必须注意行话。相同的症状可以用多种方式书写,但都指向相同的预后,即标签可以有同义词尝试阅读本文以获取有关我们如何从放射学报告中提取信息的更多信息。这是著名的CheXpert论文

从头开始,为了保持方法简单,我们必须分析以下数据的输入文本(临床叙述):

  1. 输入的是一个词还是一组词还是一个句子?

  2. 输入一个有意义的句子吗?有意义,我的意思是语法正确。

  3. 单词、词组或句子是否包含症状或健康问题?

  4. 该句子是否包含有关一个人的年龄和性别的数据?

  5. 句子中是否包含有关一个人的饮食、病史、工作常规、旅行史或与任何病人接触的数据?

如果还有其他需要寻找的属性,那么我很想从主题专家那里找到答案。