让我们考虑一个例子。我有患者级别的数据,他们的症状,从各种医学测试中读取。基于此,我构建了一个给定患者数据的二元分类器,以分类他们是否可能患有疾病,如果是,我想手动对他们进行医学测试。对于这种情况,我们会查看疾病类别并对预测概率进行排序,然后选择患病风险最高的患者。
几个月后,说这种疾病演变成另一种菌株。因此,我们已经有一类不平衡的健康与感染患者。不是新的菌株仍将是一个较小的种群。除此之外,症状,各种测试读数也会有所不同。因此,将其转化为多分类问题是有意义的。当您构建一个多分类器并且您有三个概率时,您将如何对同一组患者进行排序?
如果您对可能被感染的患者的风险感兴趣,那么将其中一种疾病的最大值作为一个好方法来进行,或者是否有一种方法可以根据他们的个体概率来选择它们?
编辑:带来更多的清晰度。multi:softprob 给出了每个类的概率。如果你有 3 个类,它会给出每个类的三个概率,总和为 1。更多细节在这里。
鉴于我们将从上面的示例中获得每行/患者的多个概率,您如何选择最终概率来对有风险的患者进行排序。