几何解释
问题中描述的估计量是以下优化问题的拉格朗日乘数等效项:
最小化 f(β) 受 g(β)≤ 吨 和 ħ (β)= 1
F(β)G(β)ħ (β)= ∥ ÿ- Xβ∥2= ∥ β∥2= ∥ Xβ∥2
可以从几何上将其视为找到与球体和椭球体的交点接触的最小椭球F(β)= RSS G(β)= tħ (β)= 1
与标准岭回归视图的比较
就几何视图而言,这更改了球体(误差)和球体()接触点的旧视图(用于标准岭回归)。进入一个新视图,我们在这里寻找球体(错误)接触曲线的点(受β范数约束的)。由于与约束的相交,一个球体(左图中的蓝色)变为较低尺寸的图形。∥ β∥2= 吨∥ Xβ∥2= 1∥ Xβ∥ = 1
在二维情况下,这很容易观察。
调整参数我们会更改蓝色/红色球体的相对长度或和的相对大小(在拉格朗日乘子理论中,可能存在一种整齐的形式化和确切地描述,这意味着对于每个,函数或逆函数都是单调函数,但是我想您可以直观地看到,残差平方和仅在我们减小时才增加。)ŤF(β)G(β) 吨λ | | β | |Ťλ| | β| |
将溶液为是因为你0和之间主张上的线βλλ = 0β大号小号
该解决方案为为(确如你评论)在第一主成分的载荷。这是对于最小的地方。这是圆在单个点上接触椭圆的点。βλλ → ∞∥ β∥2∥ βX∥2= 1∥ β∥2= 吨| Xβ| =1
在这个视图中,球和椭球的交点的边缘是点。在多个维度上,这些将是曲线∥ β∥2= 吨∥ βX∥2= 1
(我想象中的第一个,这些曲线是椭圆,但他们变得更复杂。你可以想象椭圆的球被交叉一些椭圆形截头体,但其边缘不是简单的椭圆形)∥ Xβ∥2= 1∥ β∥2≤ 吨
关于的限制λ → ∞
首先,我(先前的编辑)写道,会有一些限制在该限制之上,所有解决方案都是相同的(它们位于点)。但是事实并非如此λlimβ∗∞
将优化视为LARS算法或梯度下降。如果对于任何点都有一个方向,我们可以更改,使得惩罚项增加小于SSR项减少,那么您就不会处于最小值。ββ|β|2|y−Xβ|2
- 在正常岭回归中,在处斜率(所有方向)。因此,对于所有有限的,解不能为(因为可以采取无穷小的步骤来减少残差平方和而不增加惩罚)。|β|2β=0λβ=0
- 对于LASSO,这是不一样的,因为:惩罚是(因此,它不是零斜率的二次方)。因此,LASSO将具有某个极限值在该极限值以上,所有解都为零,因为惩罚项(乘以)将增加,而剩余平方和减小。|β|1λlimλ
- 对于受约束的山脊,您将获得与常规山脊回归相同的结果。如果您从开始更改,那么此更改将垂直于(垂直于椭圆的表面)和可以通过无穷小步骤更改,而无需更改惩罚项,但可以减少残差平方和。因此,对于任何有限的,点都不是解决方案。ββ∗∞ β β * ∞ | X β | = 1 β λ β * ∞ββ∗∞|Xβ|=1βλβ∗∞
有关限制更多说明λ→∞
到无穷大的通常岭回归极限与约束岭回归中的不同点相对应。这个“旧”限制对应于等于-1的点。然后归一化问题中Lagrange函数的导数λμ
2(1+μ)XTXβ+2XTy+2λβ
对应于标准问题中Lagrange函数的导数的解
2XTXβ′+2XTy+2λ(1+μ)β′with β′=(1+μ)β
由StackExchangeStrike撰写