Dice 系数和准确率一样吗?

机器算法验证 描述性统计 准确性 精确召回 奥克
2022-01-19 04:33:13

我遇到了体积相似性和准确性的骰子系数在我看来,这两个措施是相同的。那是对的吗?

3个回答

Dice 系数也称为 Dice 相似度指数)与F1 分数相同,但与准确率不同。主要区别可能在于准确性考虑了真负数,而 Dice 系数和许多其他度量只是将真负数作为无趣的默认值处理(请参阅分类器评估的基础知识,第 1 部分)。

据我所知,骰子系数不是按照前面的答案计算的,它实际上包含Jaccard 指数的公式(在计算机视觉中也称为“联合交集”)。

Dice(A,B)=2|AB||A|+|B|F1(A,B)=2|A|/|AB|+|B|/|AB|Jaccard(A,B)=|AB||max(A,B)|=|AB||A|+|B||AB|Accuracy(A,B)=|AB|+|A¯B¯||All|

其中二元向量(组内元素的值为 1,否则为 0),一个表示基本事实,另一个表示分类结果,只是考虑的所有元素(相同的 1 的二元向量长度)。例如,的内积)是真阳性的数量,的补码和的补码的内积)是真负数的数量。A,BAll|AB|AB|A¯B¯|AB

Dice 系数和 Jaccard 指数是单调相关的,Tversky 指数概括了它们,要了解更多信息,请参阅F-scores、Dice 和 Jaccard 集相似性

Dice 系数也是 Sensitivity 和 Precision 的调和平均值,要了解它为什么有意义,请阅读为什么 F-Measure 是调和平均值而不是 Precision 和 Recall 测量的算术平均值?.

要阅读有关此答案中的许多术语及其关系的更多信息,请参阅评估二元分类器

这些不是一回事,它们经常在不同的环境中使用。Dice 分数通常用于量化图像分割方法的性能。在那里,您可以在图像中注释一些真实区域,然后制作一个自动算法来完成它。您可以通过计算 Dice 分数来验证算法,这是衡量对象相似程度的指标。所以它是两个分割的重叠大小除以两个对象的总大小。使用与描述准确性相同的术语,Dice 分数为:

Dice score=2number of true positives2number of true positives + number of false positives + number of false negatives
因此,真阳性的数量是您的方法找到的数量,阳性的数量是可以找到的阳性的总数,而假阳性的数量是您的方法分类为阳性的阴性点的数量。

骰子分数不仅衡量您找到多少阳性,而且还惩罚该方法发现的误报,类似于精度。所以它更类似于精确度而不是准确度。唯一的区别是分母,其中您有阳性总数,而不仅仅是该方法找到的阳性数。所以骰子分数也会惩罚你的算法/方法找不到的积极因素。

编辑:在图像分割的情况下,假设您有一个带有基本事实的掩码,让我们按照您的建议因此,掩码在您要查找的内容的像素中具有值 1,否则为零。现在你有一个算法来生成图像/掩码,它也必须是一个二进制图像,即你为你的分割创建一个掩码。然后我们有以下内容:AB

  • 中强度为 1 的像素总数A
  • 真阳性中值为 1 的像素总数所以它是的区域的交集。上使用 AND 运算符相同ABABAB
  • 误报数中显示为 1但在中显示为 0的像素数BA

如果你是为出版物做这个,那么用大写的 D 写 Dice,因为它是以一个叫 Dice 的人命名的。

编辑:关于更正的评论:我不使用传统公式来计算骰子系数,但如果我将其转换为另一个答案中的符号,它将变为:

Dice score=2|AB|2|AB|+|BA|+|AB|=2|AB||A|+|B|

这相当于传统的定义。用我最初写它的方式来写它,用误报来陈述公式会更方便。反斜杠是设置的减号。

Dice 系数(也称为 Sørensen–Dice 系数和 F1 分数)定义为 A 和 B 的交点面积的两倍除以 A 和 B 的面积之和:Dice = 2 |A∩B | / (|A|+|B|) = 2 TP / (2 TP + FP + FN) (TP=True Positives, FP=False Positives, FN=False Negatives) Dice score 是图像分割问题的性能指标。这与目标是匹配值的准确性不同,这与匹配值+位置的骰子不同。