结论仅计算向量空间的维数。但是,通常情况并非如此。
矩阵乘法的最基本特性表明,由矩阵表示的线性变换满足H=X(X′X)−X′
H2=(X(X′X)−X′)2=X(X′X)−(X′X)(X′X)−X′=H,
展示它作为投影算符。因此,它的补充
Q=1−H
(如问题中所给出的)也是一个投影算子。的迹线是其等级(见下文),因此的迹线等于。HhQn−h
从其公式可以很明显地看出,是与两个线性变换和本身的组成相关的矩阵。第一个()将矢量转换为矢量。第二个()是由给出的从到。它的等级不能超过这两个维度中的较小者,在最小二乘设置中,其始终为(但可以小于H
J=(X′X)−X′
XJnypβ^XRpRny^=Xβ^pp,只要的排名不够)。因此,合成的等级不能超过的等级。
正确的结论是
JH=XJX
tr(Q)=n−p当且仅当具有全等级时;通常是。在前一种情况下,该模型被称为“可识别的”(对于的系数)。Jn≥tr(Q)≥n−pβ
J仅当是可逆的时,才具有最高等级。X′X
几何解释
H代表从向量(代表“响应”或“因变量”)到列所跨越的空间(代表“独立变量”或“协变量”)的正交投影。差示出了如何以分解任何维矢量成矢量之和其中第一个可以从 “预测”,第二个垂直于当的列生成维空间(即不是共线的)时,nyXQ=1−Hny
y=H(y)+Q(y),
XpXpH为,的排名为,反映了响应中其他附加变量,这些变量在自变量中未表示。迹线给出了这些尺寸的代数公式。
pQn−pn−p
线性代数背景
上的矢量空间中的投影算(如)是线性变换(即,自同态的),使得。这也使其补数成为投影算子,因为VRnP:V→VVP2=PQ=1−P
Q2=(1−P)2=1−2P+P2=1−2P+P=Q.
所有投影都会修复其图像的每个元素,每当我们可能会为某些写,从而v∈Im(P)v=P(w)w∈V
w=P(v)=P2(v)=P(P(v))=P(w).
与任何同构的是两个子空间:其内核及其图像 每个向量都可以用的形式,其中和。因此,我们可以为构造一个基数,其中和。当PV
ker(P)={v∈v|P(v)=0}
Im(P)={v∈v|∃w∈VP(w)=v}.
v∈Vv=w+u
w∈Im(P)u∈Ker(P)E∪FVE⊂Ker(P)F⊂Im(P)V是有限维的,因此在此基础上的矩阵将为块对角线形式,其中一个块(对应于对)全为零,另一个块(对应于的动作上)等于通过同一性矩阵,其中的维数是。的轨迹是对角线上的值之和,因此必须等于。该数字是
秩的:它的图像的尺寸。
PPEPFffFfPf×1=fP
的迹等于轨迹(等于,的尺寸)减去的迹。1−P1nVP
这些结果可以用断言投影的轨迹等于其等级的结论来概括。