弹性网的动机之一是对LASSO的以下限制:
在情况下,由于凸优化问题的性质,套索在饱和之前最多选择n个变量。这似乎是变量选择方法的限制功能。此外,除非系数的L1-范数上的界限小于某个值,否则套索的定义不明确。
(http://onlinelibrary.wiley.com/doi/10.1111/j.1467-9868.2005.00503.x/full)
我知道LASSO是一个二次规划问题,但也可以通过LARS或逐元素梯度下降来解决。但是我不明白,如果,其中是预测变量的数量,是样本大小,那么在这些算法中我会遇到问题。为什么使用弹性网解决了这个问题,我将问题扩大到明显超过变量。p n p + n p
2
如果套索限制使用以保持p <= n,那是缺点而不是优点。当p = n时,过度拟合是一个严重的问题。p = n的模型是饱和模型,通常会过拟合,因为它可以完美地拟合观察到的数据,但不一定能很好地预测未来的情况。
—
Michael R. Chernick
套索程序最多只能选择变量,这是因为可以使用LARS算法(对其稍加修改)来解决它,该算法在任何时候最多只能将变量纳入活动集中。这在弹性网情况下不成立,基本上是由于引入了惩罚,因此其行为更像是岭回归,后者的回归通常导致所有系数都不为零。Ñ ℓ 2
—
主教
感谢您的回答,以及如何看到最多可以选择n个变量的梯度下降:在cs.cmu.edu/afs/cs/project/link-3/lafferty/www/ml-stat2/talks/上的演示…论文(第4部分),
—
网址
@user:我认为您可能会将数学问题与其数值解决方案混为一谈。LARS算法显示套索解决方案最多选择变量。这与得出解决方案的实际数值方法无关,即LARS算法可提供有关问题的见解,但当然,等效解决问题的任何其他方法也必须具有相同的属性!:-)
—
红衣主教
考虑特征重复次。将存在一个套索估计器,它具有恰好非零值(即使),因此您的陈述并非如此。p p > n
—
user795305