我刚刚阅读完此讨论。他们认为,在不平衡数据集上,PR AUC比ROC AUC更好。
例如,我们在测试数据集中有10个样本。9个样本为阳性,1个样本为阴性。我们有一个糟糕的模型,它预测一切都是积极的。因此,我们将得到一个度量,TP = 9,FP = 1,TN = 0,FN = 0。
然后,Precision = 0.9,Recall = 1.0。精度和召回率都很高,但是分类器很差。
另一方面,TPR = TP /(TP + FN)= 1.0,FPR = FP /(FP + TN)= 1.0。由于FPR很高,我们可以确定这不是一个很好的分类器。
显然,在不平衡数据集上,ROC优于PR。有人可以解释为什么PR更好吗?