已经提到,正规化回归(Ridge,LASSO和Elastic Net)与其约束公式之间存在等价关系。
我还查看了交叉验证1和交叉验证2,但是我看不到明确的答案表明等价或逻辑。
我的问题是
如何使用Karush–Kuhn–Tucker(KKT)证明这种等效性?
以下公式适用于Ridge回归。
注意
这个问题不是功课。只是增加了我对该主题的理解。
更新
我还不知道
已经提到,正规化回归(Ridge,LASSO和Elastic Net)与其约束公式之间存在等价关系。
我还查看了交叉验证1和交叉验证2,但是我看不到明确的答案表明等价或逻辑。
我的问题是
如何使用Karush–Kuhn–Tucker(KKT)证明这种等效性?
以下公式适用于Ridge回归。
注意
这个问题不是功课。只是增加了我对该主题的理解。
更新
我还不知道
Answers:
更具技术性的答案是因为约束优化问题可以用拉格朗日乘数来表示。特别是,与约束优化问题相关的拉格朗日方程由
其中是选择用来满足问题约束的乘数。因此,可以通过相对于区分拉格朗日数来获得用于此优化问题的一阶条件(这已经足够,因为您正在使用适当的合适的凸函数进行工作)
但是,我认为很有用的是,为什么总的来说,对于这些优化问题,通常可以通过约束优化问题的角度或无约束问题的角度来考虑问题。更具体地说,假设我们有以下形式的无约束优化问题:
我们总是可以尝试直接解决此优化问题,但是有时将这个问题分解为有意义的问题子组件。特别是,不难看出
因此,对于固定值
编辑:根据要求,我将对岭回归进行更具体的分析,因为它可以捕获主要思想,同时又避免了与LASSO罚分的不可微性相关的技术问题。回想一下,我们正在解决优化问题(以矩阵表示法):
令为OLS解决方案(即,当没有约束时)。然后,我将集中讨论(只要存在)(因为存在),否则约束就不会引起兴趣,因为它不会绑定。可以写出此问题的拉格朗日
然后微分,得到一阶条件:
,这只是线性方程组,因此可以解决:
stats_model在他的回答中进行了大量分析。
我尝试在“岭回归的等效公式的证明”中回答类似的问题。
在这种情况下,我将采取更多的动手方法。
让我们尝试查看2个模型中和之间的映射。
正如我写的,并且可以从可以看出stats_model在他的分析中映射取决于数据。因此,我们将选择问题的具体实现。然而,代码和解决方案的草图将为正在发生的事情增加直觉。
我们将比较以下两种模型:
假设是正则化模型的解,是约束模型的解。
我们正在查看从到的映射,使得。
展望对我的解决方案,以求解的规范约束最小二乘一个可以看到,解决约束模型涉及解决的规则化模型,并找到的匹配(实际的代码呈现在最小二乘欧几里得()范数约束)。
因此,我们将运行相同的求解器,并且对于每个我们将显示最佳。
求解器主要解决:
所以这是我们的矩阵:
mA =
-0.0716 0.2384 -0.6963 -0.0359
0.5794 -0.9141 0.3674 1.6489
-0.1485 -0.0049 0.3248 -1.7484
0.5391 -0.4839 -0.5446 -0.8117
0.0023 0.0434 0.5681 0.7776
0.6104 -0.9808 0.6951 -1.1300
这是我们的向量:
vB =
0.7087
-1.2776
0.0753
1.1536
1.2268
1.5418
这是映射:
从上面可以看出,对于足够高的值,参数符合预期。
放大到[0,10]范围:
完整代码可在我的StackExchange Cross Validated Q401212 GitHub Repository中获得。