上下搜索,无法找出与预测相关的AUC代表什么或表示什么。
上下搜索,无法找出与预测相关的AUC代表什么或表示什么。
Answers:
AUC在大多数时候用来表示AUROC,这是一个不好的做法,因为正如Marc Claesen指出的那样,AUC模棱两可(可以是任何曲线),而AUROC则不是。
AUROC有几种等效的解释:
更进一步:如何得出AUROC的概率解释?
假设我们有一个概率二元分类器,例如逻辑回归。
在呈现ROC曲线(=接收器工作特性曲线)之前,必须了解混淆矩阵的概念。当我们进行二进制预测时,可以有四种类型的结果:
为了获得混淆矩阵,我们回顾了模型所做的所有预测,并计算了这四种类型的结果中每种结果发生了多少次:
在混淆矩阵的此示例中,在已分类的50个数据点中,正确分类了45个,错误分类了5个。
由于要比较两个不同的模型,使用单个度量标准而不是几个度量标准通常更方便,因此我们从混淆矩阵计算两个度量标准,然后将其合并为一个:
要将FPR和TPR合并为一个指标,我们首先要计算两个前一个指标,并使用许多不同的阈值(例如)进行逻辑回归,然后将它们绘制在一个图上, FPR值在横坐标上,TPR值在纵坐标上。所得的曲线称为ROC曲线,我们认为的度量标准是该曲线的AUC,我们称为AUROC。
下图以图形方式显示了AUROC:
在此图中,蓝色区域对应于接收器工作特性(AUROC)曲线下方的区域。对角线中的虚线表示随机预测变量的ROC曲线:AUROC为0.5。随机预测变量通常用作基准,以查看模型是否有用。
如果您想获得一些第一手的经验:
虽然我参加聚会有点晚,但这是我的5美分。@FranckDernoncourt(+1)已经提到了AUC ROC的可能解释,而我最喜欢的是他名单上的第一个(我使用了不同的措辞,但相同):
分类器的AUC等于分类器将随机选择的正例排名高于随机选择的负例的概率,即
考虑以下示例(auc = 0.68):
让我们尝试模拟它:绘制随机的正面和负面例子,然后计算正面得分高于负面得分的案例所占的比例
cls = c('P', 'P', 'N', 'P', 'P', 'P', 'N', 'N', 'P', 'N', 'P',
'N', 'P', 'N', 'N', 'N', 'P', 'N', 'P', 'N')
score = c(0.9, 0.8, 0.7, 0.6, 0.55, 0.51, 0.49, 0.43, 0.42, 0.39, 0.33,
0.31, 0.23, 0.22, 0.19, 0.15, 0.12, 0.11, 0.04, 0.01)
pos = score[cls == 'P']
neg = score[cls == 'N']
set.seed(14)
p = replicate(50000, sample(pos, size=1) > sample(neg, size=1))
mean(p)
我们得到0.67926。非常接近,不是吗?
顺便说一句,在RI中,通常使用ROCR软件包绘制ROC曲线并计算AUC。
library('ROCR')
pred = prediction(score, cls)
roc = performance(pred, "tpr", "fpr")
plot(roc, lwd=2, colorize=TRUE)
lines(x=c(0, 1), y=c(0, 1), col="black", lwd=1)
auc = performance(pred, "auc")
auc = unlist(auc@y.values)
auc
这些讨论均未包含重要考虑因素。上面讨论的过程会引起不适当的阈值设置,并会使用不正确的准确性评分规则(比例),这些规则会通过选择错误的特征并赋予错误的权重进行优化。
面对最优决策理论,连续预测的二分法立马实现。ROC曲线无法提供可行的见解。没有研究人员检查其收益,他们已经成为必须。它们具有非常大的墨水:信息比率。
最佳决策不考虑“正面”和“负面”,而是考虑结果的估计概率。效用/成本/损失函数在ROC的构建中不起作用,因此ROC的无用性被用来将风险估计转换为最佳(例如,最低预期损失)决策。
统计模型的目标通常是做出预测,而分析师通常应该在此停下来,因为分析师可能不知道损失函数。预测歧视(例如,使用引导程序)进行无偏验证的关键要素是预测歧视(衡量此差异的一种半好的方法是一致性概率,该一致性概率恰好等于ROC下的面积,但如果不这样做,则更容易理解。 “T绘制ROC)和校准曲线。如果您使用绝对规模的预测,则校准验证确实非常必要。
有关更多信息,请参见生物统计学的生物医学研究中的信息丢失一章和其他章节。
AUC是曲线下面积的缩写。它用于分类分析,以确定哪个使用的模型最能预测类别。
它的应用示例是ROC曲线。在此,将真实的阳性率与错误的阳性率作图。下面是一个示例。模型的AUC越接近1,就越好。因此,具有较高AUC的模型优于具有较低AUC的模型。
请注意,除了ROC曲线外,还有其他方法,但它们也与真实的阳性和假阳性率相关,例如精确调用,F1-Score或Lorenz曲线。
这个论坛上的答案很棒,我经常回到这里作为参考。但是,一件事总是不见了。从@Frank的答案中,我们将AUC解释为阳性样本比阴性样本得分更高的概率。同时,计算方法是绘制TPR和FPR作为阈值,更改并计算该曲线下的面积。但是,为什么曲线下的这个面积与此概率相同?@Alexy通过模拟显示它们很接近,但是我们可以用数学方法得出这种关系吗?让我们假设以下内容:
注意,TPR(调用)由以下各项给定:,而FPR(沉降)由以下各项提供:。
现在,我们在y轴上绘制TPR,在x轴上绘制FPR,绘制各种曲线,并计算该曲线下的面积()。
我们得到:
现在,只是
但是,我们从认识反变换法,对于任何随机变量,如果则。这是因为采用任何随机变量并对其应用CDF会导致统一。
在方程式(2)中使用此事实可得出:
将其代入公式(1),我们得到:
换句话说,曲线下方的面积是随机正样本比随机负样本具有更高分数的概率。
auc
您使用的标签的描述:stats.stackexchange.com/questions/tagged/auc