是的,有些情况下无法获得通常的接受者操作曲线,并且只存在一个点。
可以设置 SVM,以便它们输出类成员概率。这些将是通常的值,阈值将被改变以产生接收器操作曲线。
那是你要找的吗?
ROC 中的步骤通常发生在少量测试用例上,而不是与协变量的离散变化有关(特别是,如果您选择离散阈值,那么您最终会得到相同的点,以便对于每个新点只有一个样本发生变化它的任务)。
不断改变模型的其他(超)参数当然会产生一组特异性/敏感性对,从而在 FPR;TPR 坐标系中给出其他曲线。
曲线的解释当然取决于产生曲线的变化。
这是 iris 数据集的“versicolor”类的常用 ROC(即请求概率作为输出):
- FPR;TPR(γ = 1,C = 1,可变概率阈值):
相同类型的坐标系,但 TPR 和 FPR 作为调谐参数 γ 和 C 的函数:
这些情节确实是有意义的,但意义与通常的中华民国截然不同!
这是我使用的 R 代码:
svmperf <- function (cost = 1, gamma = 1) {
model <- svm (Species ~ ., data = iris, probability=TRUE,
cost = cost, gamma = gamma)
pred <- predict (model, iris, probability=TRUE, decision.values=TRUE)
prob.versicolor <- attr (pred, "probabilities")[, "versicolor"]
roc.pred <- prediction (prob.versicolor, iris$Species == "versicolor")
perf <- performance (roc.pred, "tpr", "fpr")
data.frame (fpr = perf@x.values [[1]], tpr = perf@y.values [[1]],
threshold = perf@alpha.values [[1]],
cost = cost, gamma = gamma)
}
df <- data.frame ()
for (cost in -10:10)
df <- rbind (df, svmperf (cost = 2^cost))
head (df)
plot (df$fpr, df$tpr)
cost.df <- split (df, df$cost)
cost.df <- sapply (cost.df, function (x) {
i <- approx (x$threshold, seq (nrow (x)), 0.5, method="constant")$y
x [i,]
})
cost.df <- as.data.frame (t (cost.df))
plot (cost.df$fpr, cost.df$tpr, type = "l", xlim = 0:1, ylim = 0:1)
points (cost.df$fpr, cost.df$tpr, pch = 20,
col = rev(rainbow(nrow (cost.df),start=0, end=4/6)))
df <- data.frame ()
for (gamma in -10:10)
df <- rbind (df, svmperf (gamma = 2^gamma))
head (df)
plot (df$fpr, df$tpr)
gamma.df <- split (df, df$gamma)
gamma.df <- sapply (gamma.df, function (x) {
i <- approx (x$threshold, seq (nrow (x)), 0.5, method="constant")$y
x [i,]
})
gamma.df <- as.data.frame (t (gamma.df))
plot (gamma.df$fpr, gamma.df$tpr, type = "l", xlim = 0:1, ylim = 0:1, lty = 2)
points (gamma.df$fpr, gamma.df$tpr, pch = 20,
col = rev(rainbow(nrow (gamma.df),start=0, end=4/6)))
roc.df <- subset (df, cost == 1 & gamma == 1)
plot (roc.df$fpr, roc.df$tpr, type = "l", xlim = 0:1, ylim = 0:1)
points (roc.df$fpr, roc.df$tpr, pch = 20,
col = rev(rainbow(nrow (roc.df),start=0, end=4/6)))