将岭回归应用于欠定方程组?


9

当,对值施加球形限制最小二乘问题可以写成 对于超定系统,。\ | \ cdot \ | _2是向量的欧几里得范数。y=Xβ+eδβ

min yXβ22s.t.  β22δ2
2

\ beta的对应解β

β^=(XTX+λI)1XTy ,
可以从拉格朗日乘数的方法得出(λ是乘数):
L(β,λ)=yXβ22+λ(β22δ2)

我知道有一个属性, \ begin {equation} \ left(X ^ TX + \ lambda I \ right)^ {-1} X ^ T = X ^ T \ left(XX ^ T + \ lambda I \ right )^ {-1} \。\ end {equation}在不确定情况下(带有添加的正则化参数\ lambda),

(XTX+λI)1XT=XT(XXT+λI)1 .
右手边类似于回归矩阵X的伪逆。这是否意味着对于不确定情况,可以使用相同的表达式近似\ beta?在不确定的情况下,是否存在针对相应表达式的单独推导,因为球面约束对于目标函数(\ beta的最小范数)是多余的:Xλββ

min. β2s.t. Xβ=y .

Answers:


12

首先将岭回归问题表述为

minXβy22+λx22

您可以将问题写为

minAβb22

哪里

A=[XλI]

b=[y0].

由于部分,矩阵具有完整的列等级。因此,最小二乘问题是唯一的解决方案AλI

β^=(ATA)1ATb

用和,并简化很多0,我们得到Xy

β^=(XTX+λI)1XTy

此推导中的任何内容都不取决于是否具有更多的行或列,甚至取决于是否具有完整的排名。因此,该公式适用于不确定情况。 XX

一个代数事实是,对于,λ>0

(XTX+λI)1XT=XT(XXT+λI)1

因此,我们也可以选择使用

β^=XT(XXT+λI)1y

要回答您的特定问题:

  1. 是的,这两个公式都适用于不确定情况以及超定情况。他们还工作,如果小于最小的行数和列数的。对于未确定的问题,第二种版本可能更有效,因为在这种情况下比小。 rank(X)XXXTXTX

  2. 我不知道从其他阻尼最小二乘问题开始并使用法线方程的公式的替代版本的任何派生。无论如何,您都可以使用一些代数以直接的方式导出它。

您可能正在考虑以下形式的岭回归问题

minβ22

服从

Xβy22ϵ.

但是,此版本的岭回归问题仅导致相同的阻尼最小二乘问题。minXβy22+λβ22


2
值得注意的是,如果具有完整的行级或完整的列级,则变为0 时,限制发生了什么。如果具有完整的列秩,则在限制中,您得到伪逆。类似地,如果具有完整的行级,则在限制中,您会得到伪逆。因此,这符合我们的预期。λXX(XTX)1XTXXT(XXT)1
Brian Borchers 2014年

这是一个非常全面的答案,从扩展数组(加上我错过的代数)的推导非常令人满意。我并不是以您最后提出的形式来考虑岭回归问题,但有趣的是,它导致了相同的目标函数。非常感谢!
hatmatrix 2014年

1
谢谢。我将在此处插入一个无耻的插件-您可以在我与Rick Aster和Cliff Thurber共同撰写的有关参数估计和反问题的教科书中找到该插件(以及许多相关材料)。
Brian Borchers 2014年

1
我还要补充一点,实际上计算该矩阵逆通常不是使用此公式的最佳方法。根据的大小和可能的稀疏性,使用迭代方案或仅使用矩阵的Cholesky分解可能会更好。XXTX+λI
Brian Borchers 2014年

感谢您的建议!感谢您对本书的参考,因为我在此材料上找不到texbook。我们的数据大小实际上不是很大(只是我们可能不得不多次将其应用于单独的数据集),因此可能适合直接逆运算,但要感谢其他指针!
hatmatrix
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.