我有一个属于医院的数据集。它包含有关患者和健康人的数据。问题是将健康的患者与患者分开。我向数据集添加了一些新功能来解决这个问题。当我减少包括新特征在内的数据维度并将数据可视化时,患者和健康个体是可区分的(视觉上可分离)。现在如果有人问使用的方法(特征提取、可视化、使用人类能力、无监督方法)和专家系统之间的关系是什么,我能说什么呢?如何使用这种方法构建专家系统?
先感谢您。
我有一个属于医院的数据集。它包含有关患者和健康人的数据。问题是将健康的患者与患者分开。我向数据集添加了一些新功能来解决这个问题。当我减少包括新特征在内的数据维度并将数据可视化时,患者和健康个体是可区分的(视觉上可分离)。现在如果有人问使用的方法(特征提取、可视化、使用人类能力、无监督方法)和专家系统之间的关系是什么,我能说什么呢?如何使用这种方法构建专家系统?
先感谢您。
专家系统依赖于从人类主题专家(例如医生团队)“提取”的知识。然后他们使用这些知识对数据进行预测(例如,如果血压 > x 则为患者)。
您的方法使用了您处理的数据集的属性。这些知识实际上是从数据本身中提取的。
第二种方法可能与专家建议兼容,也可能不兼容。如果您的算法发现血压是区分健康人和患者的一个很好的特征,您可能会发现专家同意。但是,如果您的主要特征来自多个变量的组合(例如 PCA),您可能很难找到专家来验证您的方法。
因此,您可以使用您的方法的方式是与主题专家合作,并确保您只使用对他们有意义的功能(即不要过度设计数据)。