对于非线性数据,是否应尽可能使用内核技巧?


13

我最近了解了内核技巧的用法,该技巧将数据映射到更高维度的空间,以尝试线性化那些维度中的数据。在任何情况下我都应避免使用此技术?仅仅是找到正确的内核功能的问题吗?

对于线性数据,这当然无济于事,但对于非线性数据,这似乎总是有用的。就训练时间和可伸缩性而言,使用线性分类器比非线性分类器容易得多。

Answers:


8

对于线性数据,这当然无济于事,但对于非线性数据,这似乎总是有用的。就训练时间和可伸缩性而言,使用线性分类器比非线性分类器容易得多。

@BartoszKP已经解释了为什么内核技巧很有用。为了全面解决您的问题,我想指出,内核化不是处理非线性可分离数据的唯一选择

对于模型的去线性化,至少有三个好的通用替代方案:

  • 基于神经网络的方法,您可以在其中添加一层(或多层)处理单元,从而能够将数据转换为线性可分离的情况。在最简单的情况下,它是基于S形的层,这会增加过程的非线性。一旦随机初始化,它们就会在基于梯度的上层优化中得到更新(这实际上解决了线性问题)。
  • 特别是-深度学习技术可以在此处用于准备数据以进行进一步的线性分类。这与前一个想法非常相似,但是在这里,您首先训练您的处理层,以便为基于线性模型训练的进一步微调找到一个良好的起点。
  • 随机投影-您可以从一些预定义空间中采样(非线性)投影,并在它们之上训练线性分类器。这个想法在所谓的极限机器学习中得到了充分利用,非常高效的线性求解器用于训练随机投影上的简单分类器,并获得非常好的性能(在分类和回归中的非线性问题上,例如,极限学习机器)。

综上所述-核化是一种很棒的去线性化技术,当问题不是线性的时,您可以使用它,但是这不应是盲目的“如果那么”的方法。这只是至少几种有趣的方法之一,根据问题和要求,可能会导致各种结果。特别是,ELM倾向于找到与内核化SVM所提供的解决方案非常相似的解决方案,同时可以更快地对行进行数量级的训练(因此它的扩展性比内核化SVM 更好)。


10

通常,对于线性方法,您为内核技巧支付的价格具有更差的泛化范围。对于线性模型,其VC维度维数方面也是线性的(例如,感知器的VC维度为d + 1)。

现在,如果您要对高维空间执行复杂的非线性变换,则假设集的VC维将大大变大,因为就新的高维空间而言,它的维数现在已变为线性。有了它,泛化的界限就上升了。

支持向量机通过做两件事以最有效的方式利用内核技巧:


1
就空间尺寸而言,“就重量数而言也是线性的”,而不是重量数。您可以对线性分类器进行参数化,使其具有所需的任意多个权重,但其VC维仍为d + 1(其中d为空间维)。“用于SVM模型的VC尺寸与支持向量的数量有关” VC尺寸如何精确地反映到SV的数量?我知道硬边距的界限,但是在软边距的情况下afaik没有这种关系。即使在Radamacher的复杂性范围内,您也找不到SV的数量作为变量。
lejlot 2014年

据我所知,“因此内核目标空间有多大无关紧要,就泛化范围而言,您不要松动任何东西”也是完全错误的。高维空间将导致泛化能力丧失,即使使用SVM这样的强正则化模型也是如此。
lejlot 2014年

1
@lejlot谢谢,更正了前两个错误。我需要一些时间来谈谈您的最后两
句话

1
现在几乎是正确的,但是假设的原因是内核空间的大小无关紧要?采取任何数据集,使用RBF内核和C-> inf运行SVM,您将过度拟合。这不是那么简单。特征空间中的维数是相关的,但可以使用C(作为滞后乘数的上限)进行控制。特别是-具有RBF的SVM的VC维是无穷大的,泛化约束(Vapnik的)是无用的(Radamacher可以工作,但这是完全不同的故事)。
lejlot 2014年

1
@lejlot我还提供了另一个参考-它们为软边距情况提供了一个明确的界限,并且它不依赖于维数。
BartoszKP 2014年

6

我将尝试为您的问题提供非技术性的答案。

确实,应该优先选择线性,并且由于您提到的原因,训练时间,可伸缩性,易于解释最终模型,选择处理原始模型或对偶模型,对过度拟合的更大容忍度等因素,线性应该是首选。

如果线性模型不能产生令人满意的性能,则可以尝试非线性解决方案。需要考虑的一些折衷包括:

  • 内核的选择。这并不明显,通常您需要测试不同的选项
  • 存在过度拟合训练集的危险。实际上,如果您愿意,过拟合非常容易。为了避免过度拟合,您需要一个更强大的评估框架(您需要测量未见数据的性能方差/稳定性),并且需要足够的数据才能进行正确的模型选择
  • 您对偶工作,因此无法解释最终模型,即,您不能声称特征X比特征Y更重要。
  • 训练时间随数据量的增加而增加(功能数量较少,因为它位于双通道中)

这是有关“双重工作”的有趣见解,导致无法主张功能的重要性。您对进一步解释的材料有参考吗?
javadba
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.