多类问题和多标签问题有什么区别?
多类问题和多标签问题有什么区别?
Answers:
我怀疑不同之处在于,在多类问题中,类是互斥的,而对于多标签问题,每个标签代表一个不同的分类任务,但是这些任务在某种程度上是相关的(因此将它们一起处理而不是单独处理是有好处的)。例如,在著名的钩端螺旋体蟹数据集中,有两种颜色的蟹的雄性和雌性实例。您可以将其作为具有四个类别的多类别问题(雄蓝色,雌蓝色,雄橙色,雌橙色)解决,也可以将其视为多标签问题,其中一个标签将是男性/女性,而另一个标签是蓝色/橙子。本质上,在多标签问题中,模式可以属于多个类别。
多类别分类是指具有两个以上类别的分类任务;例如,对一组水果图像进行分类,这些图像可能是橙子,苹果或梨。多类分类的假设是,每个样本都分配给一个标签,并且只能分配一个标签:水果可以是苹果或梨,但不能同时是两者。
多标签分类为每个样本分配了一组目标标签。可以将其视为预测不互斥的数据点属性,例如与文档相关的主题。文字可能同时涉及宗教,政治,金融或教育中的任何一个,或者都不涉及任何一个。
多类问题是将实例分配给有限的,互斥的类集合之一。如已经在螃蟹中提供的示例(来自@Dikran):雄蓝色,雌蓝色,雄橙色,雌橙色。这些中的每一个都是彼此排斥的,它们综合起来是全面的。
多标签问题的一种形式是将这些标签分为性别和颜色两个标签。性别可以是男性或女性,颜色可以是蓝色或橙色。但是请注意,这是多标签问题的特例,因为每个实例都会获得每个标签(也就是说,每个螃蟹都有性别和颜色)。
多标签问题还包括允许将可变数量的标签分配给每个实例的其他情况。例如,报纸或电讯服务中的一篇文章可能被分配为新闻,政治,体育,医学等类别。而另一项涉及特定体育赛事所揭示的政治紧张局势,可能会同时获得“体育”和“政治”两个标签。考虑到该事件对社会的影响,我在美国的超级碗比赛的结果被标记为SPORTS和NEWS。
请注意,这种带有可变数量标签的标签形式可以重新制作成与螃蟹示例类似的形式。除了将每个标签都视为LABEL-X或非LABEL-X之外。但并非所有方法都需要此重铸。