数据挖掘 - 你能概率性地解释支持向量机的输出吗？ - 吾爱随笔录

我正在尝试使用不同的分类算法（如随机森林、支持向量机、AdaBoost）构建二进制分类系统。我想使用这些分类器的输出来可视化分数。例如，当使用随机森林时，我想使用属于 A 类的样本的概率来构建一个从 0 到 100 的分数。假设随机森林输出一个概率（从 0 到 1），使用它作为分数是直观（我只需将其乘以 100）。然而，鉴于 SVM 输出的是分类而不是概率输出（即到超平面的距离，而不是概率），将到超平面的距离用作某种“伪概率”是否合法？例如，我会

我想确定我可以使用到超平面的距离作为伪概率，并且这个伪概率与随机森林输出的属于给定类的概率相当。例如，根据 SVM，属于 A 类的概率为 0.80 的样本与属于 A 类的（最小-最大变换）概率的另一个样本相同。