ROC曲线相互交叉时两个模型的比较


13

用于比较两个或多个分类模型的一种常用方法是使用ROC曲线(AUC)下的面积作为间接评估其性能的一种方法。在这种情况下,通常将具有较大AUC的模型解释为比具有较小AUC的模型具有更好的性能。但是,根据Vihinen,2012年(https://www.ncbi.nlm.nih.gov/pmc/articles/PMC3303716/)所述,当两条曲线相互交叉时,这种比较不再有效。为什么会这样呢?

例如,根据ROC曲线和下面的AUC,可以确定模型A,模型B和模型C的方法是什么?

在此处输入图片说明

Answers:


19

一个ROC曲线可视化TPRFPR所有可能的阈值

  • 如果绘制两个ROC曲线“ A”“ B”并且它们彼此不交叉,则您的一个分类器显然表现得更好,因为对于所有可能的FPR值,您都会获得更高的TPR。显然,中华民国之下的面积也将更大。

  • 现在,如果它们确实彼此交叉,那么对于曲线'A''B'来说,FPR和TPR相同。您不再可以说一条ROC曲线的性能更好,因为它现在取决于您喜欢哪种折衷方案。您要高精度/低调用率还是低精度/高调用率

示例:如果一个分类器在FPR为0.2时性能要好得多,但是重要的是要达到较高的Recall,那么它在您不感兴趣的阈值上会表现良好。

关于图形中的ROC曲线:您甚至可以在不知道要达到的目标的情况下轻松判断出“ A”的性能要好得多。紫罗兰色曲线一旦与其他曲线相交,便会再次与它们相交。您可能对这小部分不感兴趣,在该小部分中“ B”“ C”的性能要好一些

在下图中,您将看到两条ROC曲线,它们也彼此交叉。在这里,您无法分辨哪个更好,因为它们可以互相补充

交叉ROC曲线

请注意,归根结底,您有兴趣为分类选择一个阈值,而AUC仅使您估计模型的总体效果


在我的示例中,为确认起见,如果我选择一个非常高的临界值(精度很高),那么模型A会比B和C好很多吗?
Edu

您如何知道高精度的地方?这是ROC,而不是精确调用曲线。对于Precision,如果分类器说是Positive,则检查True Positive的概率。
Laksan Nathan
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.