我正在阅读一篇关于 ROC 和 PR 曲线的论文。他们提到了 ROC 凸包,但他们没有定义它或说明它是什么。有人可以告诉我它的含义吗?什么是 ROC 曲线中的凸包,它是什么意思?只是ROC曲线吗?!!
编辑:
来自论文:“在 ROC 空间中,凸包是一个至关重要的想法。给定 ROC 空间中的一组点,凸包必须满足以下三个标准”。所以这是一个“关键的想法”。这不是一个定义。这就像说:汽车对人类很重要。汽车有四个轮子和颜色。但它并没有说汽车就是交通工具。
我正在阅读一篇关于 ROC 和 PR 曲线的论文。他们提到了 ROC 凸包,但他们没有定义它或说明它是什么。有人可以告诉我它的含义吗?什么是 ROC 曲线中的凸包,它是什么意思?只是ROC曲线吗?!!
编辑:
来自论文:“在 ROC 空间中,凸包是一个至关重要的想法。给定 ROC 空间中的一组点,凸包必须满足以下三个标准”。所以这是一个“关键的想法”。这不是一个定义。这就像说:汽车对人类很重要。汽车有四个轮子和颜色。但它并没有说汽车就是交通工具。
该论文给出了以下定义,这几乎是一个建设性的定义:
这个的主要问题是它不是一个特别直观的东西。
那么让我们看看维基百科:
形式上,凸包可以定义为包含 X 的所有凸集的交集,也可以定义为 X 中所有点的凸组合的集合。
这非常好,并且带有一些直觉,但是(除非您有凸集的经验)并不能真正了解它是什么样的。
它还给出了凸包的常用(和直观)“橡皮筋”解释:
例如,当 X 是平面的有界子集时,凸包可以可视化为由围绕 X 拉伸的橡皮筋形成的形状
这个直观的解释必须对 ROC 曲线稍作修改,因为它们的定义方式 - ROC 的凸包满足 ROC 的条件。因此,如果我们采用固定在 (0,0) 和 (1,1) 处的拉伸“橡皮筋”,将中间向上拉到左侧,使其位于“外侧”(0,1),然后松开它使其“抓住”点,然后在 (0,0) 和 (1,1) 之间,橡皮筋将形成 ROC 的凸包:
希望现在,定义的意图应该更清楚。
在阅读了同一篇论文并四处挖掘之后,我相信凸包的重要性在于它代表了“最优”分类器,给定了一组 ROC 点。
在这种情况下,“最佳”是什么意思?
斯科特等人的这篇论文。人。“描述了一个程序,该程序将从两个现有分类器创建一个新分类器,其性能(就其 ROC 而言)位于连接其两个组件性能的线上。这是通过随机选择一个或其他分类器并使用它的结果。” [1]
所以本质上,给定来自多个分类器的一组 ROC 点,可以构建位于所有这些 ROC 点的凸包上的“最优”分类器。
[1]:我还没有真正阅读过论文,我只是在这里阅读了它的摘要:http ://www0.cs.ucl.ac.uk/staff/ucacbbl/roc/
采用 ROC 曲线点的凸包只是强制估计的 ROC 曲线是凸的(在这种情况下向下凹)的约束的一种方式。这相当于假设标记在案例和控件中的分布是单峰的。在这种假设合理的情况下,有必要施加凸性约束。