Answers:
正确分类的比例是不正确的评分规则,即通过伪造模型对其进行了优化。我将使用称为Brier分数的二次适当评分规则或一致性概率(在二元情况下,ROC曲线下的面积)。在您的情况下,随机林比SVM更好。
我认为您绝对应该研究更多指标,而不仅仅是AUC和准确性。
准确性(以及敏感性和特异性)是一个非常简单但有偏见的度量标准,它迫使您查看绝对预测结果,并且不会为主张类概率或排名而开放。它也没有考虑到人口,这会引起误解,因为该模型对人口具有95%的准确率,并且有95%的随机正确率的机会并不是一个好的模型,即使准确性很高。
AUC是断言模型准确性的好指标,而模型准确性与总体类别概率无关。但是,它不会告诉您任何有关概率估计实际值的信息。您可以得到较高的AUC,但概率估计仍然非常不正确。与准确度相比,此指标更具区别性,并且与某些适当的评分规则结合使用时,肯定会为您提供更好的模型,例如,另一篇文章中提到的Brier得分。
尽管本文非常理论化,但您可以在此处获得更正式的证明:AUC:统计上一致且更具区分性的度量,而不是准确性
但是,有一堆好的指标可用。 二进制分类概率估计和分类的损失函数:结构和应用是研究适当的评分规则(如Brier评分)的好论文。
另一篇关于断言模型性能的度量标准的有趣论文是评估:从精度,召回率和F度量到ROC,信息性,标记性和相关性等其他良好的性能度量标准,例如信息性。
总而言之,我建议您查看AUC / Gini和Brier得分以断言您对模型的性能,但是根据模型的目标,其他指标可能更适合您的问题。