Multiclass和Multilabel问题有什么区别


Answers:


45

我怀疑不同之处在于,在多类问题中,类是互斥的,而对于多标签问题,每个标签代表一个不同的分类任务,但是这些任务在某种程度上是相关的(因此将它们一起处理而不是单独处理是有好处的)。例如,在著名的钩端螺旋体蟹数据集中,有两种颜色的蟹的雄性和雌性实例。您可以将其作为具有四个类别的多类别问题(雄蓝色,雌蓝色,雄橙色,雌橙色)解决,也可以将其视为多标签问题,其中一个标签将是男性/女性,而另一个标签是蓝色/橙子。本质上,在多标签问题中,模式可以属于多个类别。



@Learner对不起,这不是我做了很多工作。您可能想看看多任务学习,它与多标签学习有些相似。也许用于此目的的某些数据集也可用作多标签学习的基准。
Dikran有袋动物2011年

26

多类别分类是指具有两个以上类别的分类任务;例如,对一组水果图像进行分类,这些图像可能是橙子,苹果或梨。多类分类的假设是,每个样本都分配给一个标签,并且只能分配一个标签:水果可以是苹果或梨,但不能同时是两者。

标签分类为每个样本分配了一组目标标签。可以将其视为预测不互斥的数据点属性,例如与文档相关的主题。文字可能同时涉及宗教,政治,金融或教育中的任何一个,或者都不涉及任何一个。

取自http://scikit-learn.org/stable/modules/multiclass.html


18

为了补充其他答案,以下是一些数字。一行=一个样本的预期输出。

多类

一栏=一类(一键编码)

在此处输入图片说明

多标签

一栏=一类

在此处输入图片说明


您会看到:

  • 在多标签的情况下,一个样本可能被分配了多个类别。
  • 在多类情况下,总共有两个以上的类。

附带说明一下,没有什么可以阻止您遇到多输出多类分类问题,例如:

在此处输入图片说明


7

多类问题是将实例分配给有限的,互斥的类集合之一。如已经在螃蟹中提供的示例(来自@Dikran):雄蓝色,雌蓝色,雄橙色,雌橙色。这些中的每一个都是彼此排斥的,它们综合起来是全面的。

多标签问题的一种形式是将这些标签分为性别和颜色两个标签。性别可以是男性或女性,颜色可以是蓝色或橙色。但是请注意,这是多标签问题的特例,因为每个实例都会获得每个标签(也就是说,每个螃蟹都有性别和颜色)。

多标签问题还包括允许将可变数量的标签分配给每个实例的其他情况。例如,报纸或电讯服务中的一篇文章可能被分配为新闻,政治,体育,医学等类别。而另一项涉及特定体育赛事所揭示的政治紧张局势,可能会同时获得“体育”和“政治”两个标签。考虑到该事件对社会的影响,我在美国的超级碗比赛的结果被标记为SPORTS和NEWS。

请注意,这种带有可变数量标签的标签形式可以重新制作成与螃蟹示例类似的形式。除了将每个标签都视为LABEL-X或非LABEL-X之外。但并非所有方法都需要此重铸。


2

另一个区别在于,多标签问题要求模型学习不同类别之间的相关性,但是在多类别问题中,不同类别是彼此独立的。

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.