我正在尝试使用不同的分类算法(如随机森林、支持向量机、AdaBoost)构建二进制分类系统。我想使用这些分类器的输出来可视化分数。例如,当使用随机森林时,我想使用属于 A 类的样本的概率来构建一个从 0 到 100 的分数。假设随机森林输出一个概率(从 0 到 1),使用它作为分数是直观(我只需将其乘以 100)。然而,鉴于 SVM 输出的是分类而不是概率输出(即到超平面的距离,而不是概率),将到超平面的距离用作某种“伪概率”是否合法?例如,我会
我想确定我可以使用到超平面的距离作为伪概率,并且这个伪概率与随机森林输出的属于给定类的概率相当。例如,根据 SVM,属于 A 类的概率为 0.80 的样本与属于 A 类的(最小-最大变换)概率的另一个样本相同。