当参数向量为p维时,为什么在最小二乘回归中踪迹为?


13

在模型y=Xβ+ϵ,我们可以使用正态方程估算β

β^=(XX)1Xy,
我们可以得到
y^=Xβ^.

残差向量可通过

ϵ^=yXβ^=(IX(XX)1X)y=Qy=Q(Xβ+ϵ)=Qϵ,

其中

Q=IX(XX)1X.

我的问题是如何得出\ textrm {tr}(Q)= n-p的结论

tr(Q)=np.

Answers:


12

结论仅计算向量空间的维数。但是,通常情况并非如此。

矩阵乘法的最基本特性表明,由矩阵表示的线性变换满足H=X(XX)X

H2=(X(XX)X)2=X(XX)(XX)(XX)X=H,

展示它作为投影算符。因此,它的补充

Q=1H

(如问题中所给出的)也是一个投影算子。的迹线是其等级(见下文),因此的迹线等于。HhQnh

从其公式可以很明显地看出,是与两个线性变换和本身的组成相关的矩阵。第一个()将矢量转换为矢量。第二个()是由给出的从到。它的等级不能超过这两个维度中的较小者,在最小二乘设置中,其始终为(但可以小于H

J=(XX)X
XJnypβ^XRpRny^=Xβ^pp,只要的排名不够)。因此,合成的等级不能超过的等级。 正确的结论JH=XJX

tr(Q)=np当且仅当具有全等级时;通常是。在前一种情况下,该模型被称为“可识别的”(对于的系数)。Jntr(Q)npβ

J仅当是可逆的时,才具有最高等级。XX


几何解释

H代表从向量(代表“响应”或“因变量”)到列所跨越的空间(代表“独立变量”或“协变量”)的正交投影。差示出了如何以分解任何维矢量成矢量之和其中第一个可以从 “预测”,第二个垂直于当的列生成维空间(即不是共线的)时,nyXQ=1Hny

y=H(y)+Q(y),
XpXpH为,的排名为,反映了响应中其他附加变量,这些变量在自变量中未表示。迹线给出了这些尺寸的代数公式。pQnpnp

线性代数背景

上的矢量空间中的投影算(如)是线性变换(即,自同态的),使得。这也使其补数成为投影算子,因为VRnP:VVVP2=PQ=1P

Q2=(1P)2=12P+P2=12P+P=Q.

所有投影都会修复其图像的每个元素,每当我们可能会为某些写,从而vIm(P)v=P(w)wV

w=P(v)=P2(v)=P(P(v))=P(w).

与任何同构的是两个子空间:其内核及其图像 每个向量都可以用的形式,其中和。因此,我们可以为构造一个基数,其中和。当PV

ker(P)={vv|P(v)=0}
Im(P)={vv|wVP(w)=v}.
vV
v=w+u
wIm(P)uKer(P)EFVEKer(P)FIm(P)V是有限维的,因此在此基础上的矩阵将为块对角线形式,其中一个块(对应于对)全为零,另一个块(对应于的动作上)等于通过同一性矩阵,其中的维数是。的轨迹是对角线上的值之和,因此必须等于。该数字是的:它的图像的尺寸。PPEPFffFfPf×1=fP

的迹等于轨迹(等于,的尺寸)减去的迹。1P1nVP

这些结果可以用断言投影的轨迹等于其等级的结论来概括


非常感谢。我从您的回答中学到了很多知识。
zhushun0008 2015年

19

@Dougal已经给出了答案,但这是另一个答案,有点简单。

首先,让我们使用的事实。因此,我们得到:现在是一个 ×单位矩阵,所以。现在,我们使用的事实,也就是说,在循环排列下轨迹是不变的。因此,我们有:当我们将与相乘时,我们得到单位矩阵,其轨迹为。因此,我们得到:tr(AB)=tr(A)tr(B)

tr(Q)=tr(I)tr(X(XX)1X).
In×ntr(I)=ntr(AB)=tr(BA)
tr(Q)=ntr((XX)1(XX)).
(XX)1(XX)p×pp
tr(Q)=np.

6

假定并且是全等级。npX

考虑紧凑的奇异值分解,其中是对角线,而具有(但注意为至多秩所以它不能是)。然后X=UΣVTΣRp×pURn×p,VRp×pUTU=VTV=VVT=IpUUTpIn

X(XTX)1XT=UΣVT(VΣUTUΣVT)1VΣUT=UΣVT(VΣ2VT)1VΣUT=UΣVTVΣ2VTVΣUT=UUT.

现在,存在一个矩阵,使得 是单一的。我们可以写 这种形式表明是正半定的,并且由于它是有效的svd且奇异值是平方对称矩阵的特征值的平方,所以还告诉我们特征值是1(重数)和0 (重数)。U2Rn×npUn=[UU2]

IX(XTX)1XT=UnUnTUUT=Un(In[Ip000])UnT=Un[000Inp]UnT.
QQnppQnp
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.