Answers:
首先,您必须问自己问题是否是多标签的(即,单个URL可以属于多个类别)(即,单个URL仅可以属于一个类别)。
如果是前者,则应使用一系列二进制分类器,因为这是处理多标签问题的默认方法。
如果是后者,答案取决于您的数据外观,分析的目的和使用的方法的组合,也许您应该同时尝试并选择最佳方法。
仅需注意,由于某些方法(如SVM)的定义方式,它们实际上无法进行多类分类,因此在内部使用了一系列二进制分类器。
这将取决于您的数据如何分散。最近有一个很好的例子,一个类似的问题,OP想知道单个线性判别函数是确定总体A与B或C还是基于将A分开的多线性判别函数的更好的分类器。 B和C。有人给出了一个非常漂亮的彩色散点图,显示了在这种情况下使用两种判别方法会比一种更好。我将尝试链接到它。
例如,某些方法可以很好地处理多类随机森林MLP。
如果您不想那样做,那么ECOC可能会很好地针对您的问题执行1-vs-All,只有测试才能证明。