Dice 系数和准确率一样吗?
Dice 系数(也称为 Dice 相似度指数)与F1 分数相同,但与准确率不同。主要区别可能在于准确性考虑了真负数,而 Dice 系数和许多其他度量只是将真负数作为无趣的默认值处理(请参阅分类器评估的基础知识,第 1 部分)。
据我所知,骰子系数不是按照前面的答案计算的,它实际上包含Jaccard 指数的公式(在计算机视觉中也称为“联合交集”)。
其中二元向量(组内元素的值为 1,否则为 0),一个表示基本事实,另一个表示分类结果,只是考虑的所有元素(相同的 1 的二元向量长度)。例如,和的内积)是真阳性的数量,(的补码和的补码的内积)是真负数的数量。
Dice 系数和 Jaccard 指数是单调相关的,Tversky 指数概括了它们,要了解更多信息,请参阅F-scores、Dice 和 Jaccard 集相似性。
Dice 系数也是 Sensitivity 和 Precision 的调和平均值,要了解它为什么有意义,请阅读为什么 F-Measure 是调和平均值而不是 Precision 和 Recall 测量的算术平均值?.
要阅读有关此答案中的许多术语及其关系的更多信息,请参阅评估二元分类器。
这些不是一回事,它们经常在不同的环境中使用。Dice 分数通常用于量化图像分割方法的性能。在那里,您可以在图像中注释一些真实区域,然后制作一个自动算法来完成它。您可以通过计算 Dice 分数来验证算法,这是衡量对象相似程度的指标。所以它是两个分割的重叠大小除以两个对象的总大小。使用与描述准确性相同的术语,Dice 分数为:
骰子分数不仅衡量您找到多少阳性,而且还惩罚该方法发现的误报,类似于精度。所以它更类似于精确度而不是准确度。唯一的区别是分母,其中您有阳性总数,而不仅仅是该方法找到的阳性数。所以骰子分数也会惩罚你的算法/方法找不到的积极因素。
编辑:在图像分割的情况下,假设您有一个带有基本事实的掩码,让我们按照您的建议因此,掩码在您要查找的内容的像素中具有值 1,否则为零。现在你有一个算法来生成图像/掩码,它也必须是一个二进制图像,即你为你的分割创建一个掩码。然后我们有以下内容:
- 正中强度为 1 的像素总数
- 真阳性和中值为 1 的像素总数。所以它是和的区域的交集。和上使用 AND 运算符相同。
- 误报数中显示为 1但在中显示为 0的像素数。
如果你是为出版物做这个,那么用大写的 D 写 Dice,因为它是以一个叫 Dice 的人命名的。
编辑:关于更正的评论:我不使用传统公式来计算骰子系数,但如果我将其转换为另一个答案中的符号,它将变为:
这相当于传统的定义。用我最初写它的方式来写它,用误报来陈述公式会更方便。反斜杠是设置的减号。
Dice 系数(也称为 Sørensen–Dice 系数和 F1 分数)定义为 A 和 B 的交点面积的两倍除以 A 和 B 的面积之和:Dice = 2 |A∩B | / (|A|+|B|) = 2 TP / (2 TP + FP + FN) (TP=True Positives, FP=False Positives, FN=False Negatives) Dice score 是图像分割问题的性能指标。这与目标是匹配值的准确性不同,这与匹配值+位置的骰子不同。