这些方法-套索和弹性网-都源于特征选择和预测的问题。我认为可以通过这两个镜头找到解释。
马修·冈恩(Matthew Gunn)在回答中很好地解释了这两个目标是截然不同的,并且通常由不同的人来承担。但是,对我们来说幸运的是,我们感兴趣的方法可以在两个领域都表现良好。
功能选择
首先,让我们谈谈功能选择。我们首先应该从套索的角度激发弹性网络。也就是说,引用Hastie和Zou的话:“如果存在成对相关性非常高的一组变量,则套索倾向于仅从该组中选择一个变量,而不关心选择哪个变量。” 例如,这是一个问题,因为这意味着我们不太可能使用套索找到真正支持的元素,而只是一个与它高度相关的元素。(本文提到,这已经在LARS论文中得到了证明,我尚未阅读。)Wainwright还指出了存在相关性时支持恢复的困难,真正的支持与互补之间存在高度相关性时为0.5。0.5
| 一个| = | b |(a ,b )= arg分一种′,b′:c = | 一种′| + | b′|(一个′)2+ (b′)2| 一个 | = |b |
顺便说一句,值得指出的是,高度相关的特征将倾向于具有非常相似的系数估计这一事实,使得我们可以检测估计的支持内的特征分组,这些分组对响应的影响类似。
预测
现在,我们继续进行预测。正如马修·冈恩(Matthew Gunn)所指出的那样,通过交叉验证选择调整参数的目的是选择一个预测误差最小的模型。由于套索选择的任何模型都可以通过弹性网(通过取)来选择,因此从某种意义上说,弹性网能够找到比套索更好地预测的模型。α = 1
Lederer,Yu和Gaynanova在没有任何假设的情况下表明,套索和弹性网都可以将其l2预测误差限制为相同的数量。它们的界限并不严格,但这可能是有趣的,因为Oracle不等式似乎是统计文献中量化估算器预测性能的标准方法-也许是因为分布是如此复杂!值得注意的是,Lederer (1)(2)在存在相关特征的情况下有一些关于套索预测的论文。
摘要
总之,感兴趣的问题是估计支持和预测之内的真正支持。对于支持恢复,有严格证明的保证(通过Wainwright),套索会在真实支持与互补之间的相关性较低的假设下,选择模型中要包含的正确特征。但是,在存在相关性的情况下,我们可以退回到弹性网,以更有可能选择真实支撑中的特征,使其成为其选择的所有特征。(请注意,我们必须在此处仔细选择调整参数。)并且,为了通过交叉验证选择调整参数时进行预测,从直觉上讲,弹性网的性能应比套索更好-特别是在存在相关性的情况下。
除了预测和一些形式,我们学到了什么?我们了解了真正的支持。
置信区间
值得指出的是,在过去的两年中,关于套索的有效推断发生了很大变化。特别是,Lee,Sun,Sun和Taylor的工作为在选择给定模型的情况下套索的系数提供了准确的推论。(在OP发表之时,关于套索的真实系数的推论结果大约是在此,并在链接的论文中得到了很好的总结。)