1
在二进制分类设置中,准确性是否是不正确的评分规则?
我最近一直在学习针对概率分类器的正确评分规则。该网站上的多个主题强调了准确性是不正确的评分规则,不应将其用于评估概率模型(如逻辑回归)生成的预测的质量。 但是,我阅读的许多学术论文都给出了误分类的损失,以此作为二进制分类设置中(非严格)正确评分规则的一个示例。我能找到的最清晰的解释是在本文的第7页底部。据我所知,使分类错误的损失最小化等于使准确性最大化,并且本文中的方程式很直观。 例如:使用本文的表示法,如果感兴趣类别的真实条件概率(给定某些特征向量x)为η= 0.7,则任何预测q > 0.5的预期损失R(η| q)= 0.7(0)+ 0.3(1)= 0.3,则任何q 0.5都将具有0.7的预期损失。因此,损失函数在q =η= 0.7时将最小化,因此是适当的;从那里到真正条件概率和预测整个范围的泛化似乎很简单。≤≤\leq 假设以上计算和陈述正确无误,那么最小值的缺点就很明显,所有高于0.5的预测均具有相同的最小预期损失。我仍然没有理由在诸如log得分,Brier得分等传统方法上使用准确性。但是,在二进制环境中评估概率模型时,说准确性是一个正确的评分规则是正确的吗?错误-是我对分类错误的理解,还是将其等同于准确性?