我认为混乱可能是由于一些简单的事情引起的,但是它提供了一个很好的机会来审查一些相关问题。
请注意,本文并未声称所有回归系数可以通过连续残差向量计算为
但是这样只能计算最后一个!β^i
β^i=?⟨y,zi⟩∥zi∥2,
β^p
连续正交化方案(一种Gram–Schmidt正交化形式)(几乎)产生一对矩阵和,使得
其中为具有正交列的,为上三角。我说“几乎”是因为该算法仅指定直到列的范数,通常不会为1,而是可以通过对列进行标准化并对坐标进行相应的简单调整来使其具有单位范数矩阵。ZG
X=ZG,
Zn×pG=(gij)p×pZG
当然,假设具有等级,唯一的最小二乘解是向量,它可以解决系统
X∈Rn×pp≤nβ^
XTXβ^=XTy.
代入并使用(通过构造),我们得到
等效于
X=ZGZTZ=I
GTGβ^=GTZTy,
Gβ^=ZTy.
现在,专注于线性系统的最后一行。在最后一行中唯一的非零元素是。因此,我们得到
不难看出(验证一下是否理解!)这样就产生了解决方案。(警告:我使用已经标准化以具有单位范数,而在书中则没有。这说明了这样的事实,即书中分母具有平方范数,而我只有范数。)Ggpp
gppβ^p=⟨y,zp⟩.
gpp=∥zp∥zi
要找到所有回归系数,需要执行一个简单的反替代步骤来求解单个。例如,对于第,
等等
可以继续执行此过程,从系统的最后一行到第一个行“向后”,减去已经计算出的回归系数的加权和,然后除以前导项即可得到。β^i(p−1)
gp−1,p−1β^p−1+gp−1,pβ^p=⟨zp−1,y⟩,
β^p−1=g−1p−1,p−1⟨zp−1,y⟩−g−1p−1,p−1gp−1,pβ^p.
giiβ^i
ESL部分中的要点是,我们可以对的列进行重新排序以获得一个新矩阵,而第个原始列现在是最后一个。如果然后在新矩阵上应用Gram–Schmidt过程,则会得到新的正交化,从而可以通过上述简单解找到原始系数的解。这为我们提供了回归系数的解释。这是在残差向量上的单变量回归,该残差向量是通过从 “回归”设计矩阵的其余列而。XX(r)rβ^rβ^ryxr
常规QR分解
Gram–Schmidt过程只是产生的QR分解的一种方法。确实,有很多理由比Gram–Schmidt过程更喜欢其他算法方法。X
Householder反射和Givens旋转提供了解决此问题的更数值稳定的方法。注意,在二维分解的一般情况下,上述发展不会改变。即,让
是任何的QR分解。然后,使用与上述完全相同的推理和代数运算,我们得到最小二乘解满足
简化为
由于是上三角,因此相同的反替代技术也可以使用。我们首先解决
X=QR,
Xβ^RTRβ^=RTQTy,
Rβ^=QTy.
Rβ^p然后从下往上进行。使用
哪种 QR分解算法通常取决于控制数值不稳定性,从这个角度来看,Gram–Schmidt通常不是竞争性方法。
将分解为正交矩阵的概念还可以进一步推广,以得到拟合向量的非常通用的形式,但我担心此响应已经太长了。Xy^