Answers:
首先,让我们尝试正式定义ROC曲线下的面积。一些假设和定义:
我们有一个概率分类器,输出一个“分数” s(x),其中x是特征,而s是估计概率p(class = 1 | x)的一般递增单调函数。
,其中:= k类分数的pdf,CDF为
将得分s与阈值t进行比较,即可获得新观察值的分类
此外,为了数学上的方便,让我们考虑正类(检测到事件)k = 0,而负k =1。在此设置中,我们可以定义:
ROC曲线就是对 F 1(t )的曲线 。设置v = ˚F 1(小号)中,我们可以在形式上定义的区域中的ROC曲线下: 甲Ù Ç = ∫ 1 0 ˚F 0(˚F - 1 1(v ))d v 改变变量(d v = ˚F 1(小号)d 小号
可以容易地将此公式视为类别0的随机抽取成员的得分低于类别1的随机抽取成员的得分的概率。
该证明来自:https : //pdfs.semanticscholar.org/1fcb/f15898db36990f651c1e5cdc0b405855de2c.pdf