绩效衡量:为什么叫召回和敏感性?

数据挖掘 表现 术语
2021-10-14 02:37:52

精度是检索到的相关实例的比例,而召回率(也称为灵敏度)是检索到的相关实例的比例。

我知道它们的含义,但我不知道为什么它被称为召回我不是以英语为母语的人。我知道recall就是remember,那么我不知道这个意思和这个概念的相关性!也许覆盖范围更好,因为它显示了覆盖了多少实例……或任何其他术语。

而且敏感度对我来说也是麻木的!

你能帮我把这些词与这个概念联系起来并了解它们吗?

4个回答

我认为“敏感性”这个词来自医学测试的世界。一项非常敏感的测试对于大多数或所有接受测试并确实患有疾病的人以及许多没有患病的人来说都是阳性的。这对应于高召回率,这意味着查询检索大部分或所有相关文档,以及许多可能不相关的文档。

召回意味着带回或记住。该术语来自信息检索,通常将其应用于查询的结果集。我想它的意思是,查询检索到了多少正确答案集?有多少被召回?

我不知道“覆盖”是否更好。“敏感性”一词也用于与“回忆”相同的意思。无论如何,这些只是这些想法的标准词汇。

召回被称为“召回”,因为它是被“召回”的相关(训练集)实例的一部分(如您所建议的那样是或“检索”。“覆盖”会更加模棱两可,它可能会被误解为其他事物,例如你训练的训练集的百分比(例如一个分区。你建议的“覆盖”对训练集有意义,但对测试集没有意义,因此它太模棱两可了)。

我一直认为“召回”也被称为“敏感性”的原因是由于信号处理或医学影响:想想探雷器、雷达或疾病测试:“敏感”意味着它会捡起大多数/所有已知的相关示例(来自训练集)。

是的,这些术语的大多数晦涩难懂的名称都非常不直观,并且是从几十年来不同领域的词汇中拼凑而成的拼凑被子,但它们现在已经一成不变,所以你只需要找到一个助记符来学习它们而不是得到太挂在他们身上,继续做事情......

免责声明:我也不是母语人士。

我首先想到的是,您有时会在新闻中听到一些汽车制造商由于某些问题需要召回某些车辆。但通常,他们只根据某些标准召回汽车。因此,并非所有有问题的汽车都被“召回”。换句话说,虽然一些有问题的人(真阳性)被召回,但其他一些有问题的人可能不符合召回的标准(假阴性)。

我认为敏感性可以从“召回的规则/标准”的角度来解释。更高的敏感度意味着规则对问题更敏感(例如汽车问题),但这可能会导致更高的误报。

所以总的来说,召回是成功识别(召回)百分比的真正积极因素之一。敏感度是分类规则/算法对问题的敏感程度(真阳性的属性)。