我有两个分类器
- 答:朴素的贝叶斯网络
- B:树(单连接)贝叶斯网络
在准确性和其他度量方面,A的性能比B差。但是,当我使用R包ROCR和AUC进行ROC分析时,事实证明A的AUC高于B的AUC。这是为什么发生了什么?
真阳性(tp),假阳性(fp),假阴性(fn),真阴性(tn),敏感性(sen),特异性(spec),阳性预测值(ppv),阴性预测值(npv)和A和B的精度(acc)如下。
+------+---------+---------+
| | A | B |
+------+---------+---------+
| tp | 3601 | 769 |
| fp | 0 | 0 |
| fn | 6569 | 5918 |
| tn | 15655 | 19138 |
| sens | 0.35408 | 0.11500 |
| spec | 1.00000 | 1.00000 |
| ppv | 1.00000 | 1.00000 |
| npv | 0.70442 | 0.76381 |
| acc | 0.74563 | 0.77084 |
+------+---------+---------+
除了边际上的感觉和联系(spec和ppv)(不包括tp,fn,fn和tn)外,B似乎比A更好。
当我计算sens(y轴)与1-spec(x轴)的AUC时
aucroc <- auc(roc(data$prediction,data$labels));
这是AUC比较。
+----------------+---------+---------+
| | A | B |
+----------------+---------+---------+
| sens vs 1-spec | 0.77540 | 0.64590 |
| sens vs spec | 0.70770 | 0.61000 |
+----------------+---------+---------+
所以这是我的问题:
- 当B在准确性方面“似乎”优于A时,为什么A的AUC比B更好?
- 那么,我如何真正判断/比较A和B的分类表现呢?我的意思是,我使用AUC值吗?我是否使用acc值,为什么?
- 此外,当我对A和B应用适当的评分规则时,B在对数损失,二次损失和球面损失方面都优于A(p <0.001)。这些如何权衡关于AUC的分类性能?
- A的ROC图看起来非常平滑(它是一条弧线),但是B的ROC图看起来像一组连接的线。为什么是这样?
根据要求,以下是模型A的图。
这是模型B的图。
这是A和B的概率分布的直方图(中断设置为20)。
这是B与A的概率散布图。