Answers:
(您可能首先要看下面的“表格”)
让我们从“经典”支持向量机开始。他们学会了区分两个类别。您收集了一些类别A的示例,一些类别B的示例,并将它们都传递给SVM训练算法,该算法会找到最能将A与B分开的线/平面/超平面。您想区分定义明确的类别和相互排斥的类别:男人与女人,字母表中的字母,等等。
但是,假设您要标识“ A”。您可以将其视为分类问题:如何区分“ A”和“非A”。收集由狗的图片组成的训练集非常容易,但是非狗训练集应包含哪些内容呢?由于有无数种不是狗的东西,因此您可能很难构建一个包含所有非犬类东西的全面而有代表性的训练集。相反,您可以考虑使用一类分类器。传统的两类分类器会找到一个将A与B分开的(超)平面。一类SVM会找到一个将所有同类点(“ A”)与原点分开的线/平面/超平面;
Ensemble SVM“系统”实际上是许多两类SVM“子单元”的集合。每个亚基是利用受过训练的单一类的正面例子,而另一类的负面例子很多。因此,不是区分狗与非狗实例(标准的两类SVM),还是狗与起源的实例(一类SVM),每个子单元都区分特定狗(例如“雷克斯”)和许多非狗。例子。每个阳性子类别的个体SVM都经过训练,因此您将有一个SVM用于Rex,另一个SVM用于Fido,另外一个用于邻居的狗,该狗在6am吠叫,依此类推。校准并组合这些子单元SVM的输出,以确定在测试数据中是否出现了一只狗,而不仅仅是特定示例之一。我猜您也可以将单个子类别想像成一类SVM,其中的坐标空间发生了偏移,因此单个正例位于原点。
总之,主要区别在于:
附言:您曾问过它们的含义“ [其他方法]要求将示例映射到可以计算相似性内核的公共特征空间”。我认为它们的意思是,传统的两类SVM在假设类的所有成员都相似的情况下运行,因此您想找到一个内核,该内核将伟大的danes和dachsunds彼此靠近,但彼此远离。相比之下,如果它足够像丹麦犬(Dane)或腊肠犬(Dachsund)或贵宾犬(贵宾犬),那么集成的SVM系统就会通过称呼狗为狗,而不必担心这些示例之间的关系。
简而言之,ESVM模型是一组经过训练以区分所有单个训练集元素与所有其余训练元素的SVM,而OSVM模型是一组经过训练以区分属于一个类别的训练元素的每个子集的SVM。因此,如果训练集中有300只猫和300只狗的实例,则ESVM将制作600个 SVM,每个用于一只宠物,而OSVM将制作两个 SVM(第一个用于所有猫,第二个用于所有狗)。
这样,ESVM不需要找到整个类都在其中聚类的空间,而是需要找到一个元素在其中是离群值的空间,这可能会更简单并导致更高的精度。召回由合奏提供。