Answers:
许多分类器可以预测连续得分。通常,连续分数是中间结果,仅在分类的最后一步才转换为类别标签(通常按阈值)。在其他情况下,例如,可以计算类成员的后验概率(例如,判别分析,逻辑回归)。您可以使用这些连续得分而不是类别标签来计算MSE。这样做的好处是避免了由于二分法导致的信息丢失。
当连续得分是概率时,MSE指标称为Brier得分。
但是,也存在分类问题,它们是变相的回归问题。在我的领域中,例如可以根据某种物质的浓度是否超过法律限制对案件进行分类(这是二元/区分性两类问题)。在这里,由于任务的潜在回归特性,MSE是自然选择。
在本文中,我们将其作为更通用的框架的一部分进行解释:
C. Beleites,R。Salzer和V. Sergo:
使用部分类成员资格的软分类模型的验证:Sensitivity&Co.的扩展概念应用于星形细胞瘤组织的分级。
Chemom。智力 实验室 Syst。,122(2013),12-22。
如何计算它:如果您使用R语言,则一个实现位于软件包“ softclassval”中,http:/softclassval.r-forge.r-project.org。
从技术上讲可以,但是对于二进制分类,MSE函数是非凸的。因此,如果使用MSE Cost函数训练二进制分类模型,则不能保证将Cost函数最小化。同样,将MSE用作成本函数时,假定了高斯分布,而不是二进制分类。