这是个有趣的问题。出乎意料的是,可以在某些假设下做某事,但是可能会丢失有关残差的信息。它取决于损失了多少。X
让我们考虑以下奇异值分解,其中和为矩阵与正交列,为对角矩阵,其正值为在对角线和 a正交矩阵中。然后,列构成的列空间的正交基础,并且
是在该列空间中展开时在该列空间上的投影的系数向量。 X ù Ñ × p d d 1 ≥ d 2 ≥ 。。。≥ d p > 0 V p × p Ù X Ž = Ù 吨 Ŷ = d - 1个 V 吨 V d Ù 吨 Ŷ = d - 1个 V 吨 X 吨 ÿ ÿX=UDVtXUn×pDd1≥d2≥...≥dp>0Vp×pUX
Z=UtY=D−1VtVDUtY=D−1VtXtY
Yž XU列基础。从公式中可以看出,仅可根据和知识进行计算。
ZXXtY
由于给定的岭回归预测因子可以计算为
我们看到在列基础上
岭回归预测因子的系数为
现在我们进行分布假设,即具有维均值和协方差矩阵。那么具有维平均和协方差矩阵。如果我们想象一个独立的ÿ = X (X 吨 X + λ 我)- 1 X 吨 Ŷ = û d (d 2 + λ 我)- 1 d Ù 吨 Ŷ = û d (d 2 + λ 我)- 1 d ž ù ž = d (d 2 + λ 我)-λ
Y^=X(XtX+λI)−1XtY=UD(D2+λI)−1DUtY=UD(D2+λI)−1DZ
UÿÑξ σ 2 我Ñ Žp ü 吨 ξ σ 2 我p ý 新 ýX Ž 新 = û 吨 ý 新 ž Ë | | Ÿ 新- ÿ | | 2Z^=D(D2+λI)−1DZ.
Ynξσ2InZpUtξσ2IpYNew具有与相同的分布的(从此以后所有条件都存在于),相应的具有相同的分布分布为并且是独立的,并且
在这里,第三个等式之后是和的正交性第四点是
YXZNew=UtYNewZE||YNew−Y^||2===E||YNew−UZNew+UZNew−UZ^||2E||YNew−UZNew||2+E||UZNew−UZ^||2Err0+E||ZNew−Z^||2.
YNew−UZNewUZNew−UZ^U具有正交列。数量是一个错误,我们无法获取有关的任何信息,但也不依赖于。为了最小化左侧的预测误差,我们必须最小化右侧的第二项。
Err0λ
通过标准计算
在这里,被称为使用参数进行岭回归的有效自由度。的无偏估计是
E||ZNew−Z^||2==E||Z−Z^||2+2∑i=1pcov(Zi,Z^i)E||Z−Z^||2+2σ2∑i=1pd2id2i+λdf(λ).
df(λ)λE||Z−Z^||2err(λ)=||Z−Z^||2=∑i=1p(1−d2id2i+λ)2Z2i.
我们将其与的(无偏)估计量
结合起来因为我们知道,然后需要将其最小化。显然,这只能如果我们知道做,或在一个合理的猜测或估计的。
err(λ)+2σ2df(λ)
E||ZNew−Z^||2σ2σ2σ2
估计可能会有更多问题。可能表明
因此,如果可以选择很小的使得平方偏差可以忽略,我们可以尝试将估计为
这是否会工作,取决于很多。σ2
E||Z−Z^||2=σ2⎛⎝⎜⎜⎜⎜⎜p−∑i=1pd2id2i+λ(2−d2id2i+λ)d(λ)⎞⎠⎟⎟⎟⎟⎟+bias(λ)2.
λσ2σ^2=1p−d(λ)||Z−Z^||2.
X
有关某些详细信息,请参见ESL中的 3.4.1节和第7章,或者GAM中可能更好的第2章。