如何将神经网络应用于多标签分类问题?


12

描述:

让问题域为文档分类,其中存在一组特征向量,每个特征向量属于一个或多个类。例如,文档doc_1可能属于SportsEnglish类别。

题:

使用神经网络进行分类,特征向量的标签是什么?它是构成所有类的向量,以便对不相关的类赋予0值,对相关的类赋予1值吗?因此,如果类标签的列表为[Sports, News, Action, English, Japanese],那么对于文档doc_1,标签将为[1, 0, 0, 1, 0]

Answers:


3

是的,在多标签学习中,标签信息通常被编码为您描述的二进制向量。这样也更容易进行评估。

我们可能要检查MULAN,这是一个用于多标签学习的开源Java库。它是Weka的扩展,已经实现了许多多标签分类器,包括神经网络。例如,您可以在此处找到BP-MLL 。


8

这似乎是您要寻找的论文:

张敏玲和周志华:多标签神经网络及其在功能基因组学和文本分类中的应用

从摘要:

在多标签学习中,训练集中的每个实例都与一组标签相关联,任务是输出一个标签集,对于每个看不见的实例,标签集的大小都是先验未知的。提出了一种称为BP-MLL的神经网络算法,即用于多标签学习的反向传播。...应用于两个现实世界中的多标签学习问题,即功能基因组学和文本分类,表明BP-MLL的性能优于某些完善的多标签学习算法。

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.