我遇到了体积相似度(https://en.wikipedia.org/wiki/S%C3%B8rensen%E2%80%93Dice_coefficient)和准确性(https://en.wikipedia.org/wiki/Accuracy_and_precision)的骰子系数)。
在我看来,这两种措施是相同的。有什么想法吗?
我遇到了体积相似度(https://en.wikipedia.org/wiki/S%C3%B8rensen%E2%80%93Dice_coefficient)和准确性(https://en.wikipedia.org/wiki/Accuracy_and_precision)的骰子系数)。
在我看来,这两种措施是相同的。有什么想法吗?
Answers:
这些不是一回事,它们经常在不同的上下文中使用。Dice分数通常用于量化图像分割方法的性能。在那里,您可以在图像中注释一些地面真实区域,然后制定自动化算法来做到这一点。您可以通过计算Dice分数来验证算法,Dice分数可以衡量对象的相似程度。因此,这是两个细分的重叠部分的大小除以两个对象的总大小。使用与描述准确性相同的术语,Dice分数为:
Dice分数不仅可以衡量您发现多少阳性结果,还可以对方法发现的假阳性结果进行惩罚,类似于精确度。因此,它更类似于精度而不是精度。唯一的区别是分母,在分母中,您拥有的是阳性的总数,而不仅仅是方法发现的阳性。因此,Dice分数还会惩罚您的算法/方法无法找到的肯定值。
编辑:在图像分割的情况下,假设您有一个具有地面真实性的蒙版,让我们按照您的建议将其称为蒙版因此,遮罩在您要查找的某些像素中的值为1,否则为零。现在,您有了一种算法来生成图像/遮罩,该图像也必须是二进制图像,即为分割创建遮罩。然后我们有以下内容:
如果您要为出版物执行此操作,请用大写D来写Dice,因为它是以一个叫Dice的人命名的。
编辑:关于更正的评论:我不使用传统公式来计算Dice系数,但是如果我将其转换为其他答案中的符号,它将变成:
这等效于传统定义。用我最初编写它的方式来更方便,以便用误报的方式陈述公式。反斜杠是设置的负号。
该骰子系数(也称为骰子相似指数)是一样的F1得分,但它是不一样的精度。主要区别可能是这样的事实,即准确性考虑了真实的负数,而Dice系数和许多其他度量只是将真实的负数作为无趣的默认值处理(请参阅分类器评估的基础,第1部分)。
据我所知,Dice系数的计算并非如先前的答案所述,该答案实际上包含Jaccard索引的公式(在计算机视觉中也称为“联合上方的交集”)。
其中二进制向量(组中元素的值为1,否则为0),一个表示基础事实,另一个表示分类结果,而就是所有被考虑的元素(相同的1的二进制向量)长度)。例如,(和内积)是真实正数,(的补码和的补码的内积)是真实负数的数量。
Dice系数和Jaccard索引是单调相关的,而Tversky索引将二者概括化,要了解更多信息,请参阅F得分,Dice和Jaccard集的相似性。
Dice系数也是灵敏度和精度的谐波平均值,要了解为什么它有意义,请阅读为什么F-Measure是谐波平均值而不是Precision and Recall度量的算术平均值?。
要了解有关此答案中许多术语及其关系的更多信息,请参阅二进制分类器的评估。