我正在研究 ROC 曲线,我想知道是否有任何分类算法不会由于算法概率的某个阈值而返回输出类?
因为如果有一个,如果你不能使用阈值来绘制它,你怎么会有 ROC 曲线,因为它给出了输出类作为确定性?
我正在研究 ROC 曲线,我想知道是否有任何分类算法不会由于算法概率的某个阈值而返回输出类?
因为如果有一个,如果你不能使用阈值来绘制它,你怎么会有 ROC 曲线,因为它给出了输出类作为确定性?
TLDR:构建 ROC 曲线不需要概率,只需要支持决策的数字尺度。
我正在研究 ROC 曲线,我想知道是否有任何分类算法不会由于算法概率的某个阈值而返回输出类?
我之前放过这个问题,因为我专注于实际问题。许多算法根本不输出概率(这实际上是它们的主要卖点之一)。例如,SVM 和 K-NN。
下面我将解释为什么构建 ROC 曲线不是问题。
因为如果有一个,如果你不能使用阈值来绘制它,你怎么会有 ROC 曲线,因为它给出了输出类作为确定性?
如果您的算法没有为您的决策提供任何其他数值支持,那么您的 ROC 曲线只有一个点。
就其本身而言,它不是一个错误的 ROC,但它的实用性值得怀疑。
所以我想说,如果你没有这个比例(连续或不连续),那么你就无法绘制 ROC 曲线。
幸运的是,大多数算法确实具有这种规模。在 SVM 中,它是到边缘的距离,在逻辑回归中,它是输出概率,在决策树中,它是叶概率,在 K-NN 中,它是邻域投票比例,等等。
支持向量机和-最近的邻居浮现在脑海中。
(有关简短答案的动机,请参见此处。总是欢迎更长的答案。)