关于正规方程证明的问题


11

在不假设X是可逆的前提下,如何证明正则方程具有一个或多个解?(XTX)β=XTY

我唯一的猜测是它与广义逆有关,但是我完全迷失了。


1
通过提问能激发出惊人答案的问题,您可以获得积分。
Nikana Reklawyks

Answers:


14

一个人很想成为glib并指出,因为二次形式

β(YXβ)(YXβ)

是正半定数,存在一个,它的最小值,并且通过正常方程式找到了最小值(通过将相对于的梯度设置为零)βββ

XX(YXβ)=0,

那里必须有至少一个解决方案,无论职级的XX。但是,该论点似乎不符合问题的精神,这似乎是纯粹的代数陈述。也许有趣的是要理解为什么这样的方程式必须有一个解,以及在什么条件下。因此,让我们重新开始并假装我们不知道最小平方的连接。


这一切都归结到意义,的转置。结果将是一个简单的定义,适当的表示法以及非简并半线性形式的概念 回想一下,是行(每个观察值一个)和列(每个变量一个,包括一个常数,如果有的话)的“设计矩阵” 。因此,它表示从向量空间到的线性变换。 X X ñ p V = - [R p w ^ = [R ÑXXXnpV=RpW=Rn

的转置被认为是线性变换,是对偶空间的线性变换。为了理解类似的组成,必须将标识为。这就是上通常的内积(平方和)。X w ^ *V * X ' X w ^ * w ^ w ^X X:WVXXWWW

实际上,在和分别定义了两个内积和。这些是非退化的实值双线性对称函数。后者意味着g W V WgVgWVW

gW(u,v)=0 uWv=0,

与类似语句。从几何学上讲,这些内积使我们能够测量长度和角度。条件可以认为是与 “垂直” 。非简并性意味着仅零向量垂直于整个向量空间。(这种普遍性意味着,此处获得的结果将适用于广义最小二乘设置,对于该最小二乘设置,不一定是作为分量乘积之和给出的常规内积,而是某种任意的简并形式。我们可以完全省去,定义 g u v = 0 u v g W g V X 'WVgVg(u,v)=0uvgWgVX:WV,但我希望许多读者对双重空格不熟悉或不满意,因此请选择避免这种表述。)

与这些内积在手,任何线性变换的转置由下式定义经由X WVX:VWX:WV

gV(X(w),v)=gW(w,X(v))

所有和。可以通过用和基数写出东西来确定确实存在向量 ; 该向量是唯一的,是由于内积的非简并性所致。对于如果和是两个向量,其中所有,则(从第一个分量的线性起)对于所有,意味着。 v V X '瓦特V V w ^ v 1个v 2 VvwWvVX(w)VVWv1v2v V Vv 1 - v 2v = 0 v v 1v 2 = 0gV(v1,v)=gV(v2,v)vVgV(v1v2,v)=0vv1v2=0

当为与每个向量垂直的所有向量的集合写。也如符号,写入的问题为的图像,定义为集合。 及其转置之间的基本关系ûù X VX { X v | v V } W¯¯ X X 'UW,UUX(V)X{X(v)|vV}WXX

X(w)=0wX(V).

即,是在内核当且仅当是垂直于图像。X ' w ^ XwXwX 该断言说明了两件事:

  1. 如果,则对于所有,表示垂直于。WX(w)=0v V瓦特X V gW(w,X(v))=gV(X(w),v)=gV(0,v)=0vVwX(V)

  2. 如果垂直于,则仅对所有意味着,但这等效于并且简并性意味着。X Vg wwX(V)v V VX '瓦特v = 0 V X '瓦特= 0gW(w,X(v))=0vVgV(X(w),v)=0gVX(w)=0

我们实际上已经完成了。 分析表明分解为直接乘积。也就是说,我们可以取任意并将其唯一地写为其中和。这意味着对于至少一个的形式为。注意,那w ^ = X VX V Ý W¯¯ ÿWW=X(V)X(V) yWÿ 0X Vý X V Ý 0 X β β Vy=y0+yy0X(V)yX(V)y0X(β)βV

yXβ=(y0+y)y0=yX(V)

基本关系说与的内核中的左侧相同:X

X(yXβ)=0,

何处求解正规方程X ' X β = X ' ý βXXβ=Xy.


我们现在可以对这个问题给出简短的几何答案(以及一些有启发性的评论):正规方程式有一个解,因为任何向量(唯一)分解为向量的和。在范围和另一矢量 垂直于和是至少一种的图像维矢量。图像的尺寸(其等级)是可识别参数的尺寸。核的维数ÿ W¯¯ ÿ 0 X ÿ nyWy0Xyý 0 p β V X VX X V w ^y0y0pβVX(V)X计算参数之间的非平凡线性关系。当是从到图像的一对一映射时,所有参数都是可识别的。XVW

最终完全放弃空间并完全使用子空间(矩阵的“列空间”),最终很有用。正规方程量正交投影。这从概念上使我们摆脱了对模型的任何特定参数化的约束,并表明最小二乘法模型具有固有维度,而与它们如何被参数化无关。û = X Vw ^ X ùVU=X(V)WXU


这一抽象代数演示的一个有趣结果是,我们可以求解任意向量空间中的正规方程。 对于复杂空间,有限域上的空间(最小化平方和几乎没有意义),甚至在支持适当的半线性形式的无穷维空间上,结果都适用。


1
直到很久以后,我才开始代表代表接受这个答案。我只是偶然发现了这个,想再次感谢您!
ryati

我会将那个二次形式写为而不是并且使用另一个箭头进行类似β →交通ÿ - X
β(YXβ)(YXβ)
˚F
β(YXβ)(YXβ),
f:AB.
Michael Hardy

@Michael您的评论中肯定存在印刷错误。您介意澄清您的意思吗?
ub

@whuber:我发现没有印刷错误。关键是两个箭头和具有不同的含义。''''
Michael Hardy

@Michael原谅我尽管有很多读物却没有看到这种区别。无论如何,对我来说,第一个箭头指的是内射函数,而第二个箭头指的是任何函数,但是我怀疑这不是您想要的。您介意解释您的符号吗?
ub

0

如果样本集中至少存在两个不同的值(预测变量),则很容易证明(尝试为任意数量的点)存在的逆。仅当所有数据的值均相同(即,沿垂直线沿方向堆叠的点)时,通过均值绘制的任何线才具有任意斜率(回归系数) ,因此LSE回归线不是唯一的。X Ť X X X = X ÿ ¯ ÿnXTXxxi=xyy¯


为了完整,用于简单线性回归,而用于多元线性回归。X = [ 1 x 11x m 1 ; 1 X 1 ñ ... X Ñ ]X=[1 x1;1 x2;;1 xn]X=[1 x11xm1;;1 x1nxmn]
Lucozade 2013年

3
评论中对多元回归的提及令人费解,因为此答案显然仅适用于普通回归的情况,在这种情况下,拟合“线”而不是高维曲面。此外,你似乎已经回答了另一个问题:这个人问在哪里的情况下是不可逆的。XX
ub

0

在典型的回归中,X是骨感的,因此肯定不是不可逆的(尽管它可能是不可逆的。)很容易证明(如果需要帮助,请问)如果X是骨感并且保持可逆的,则X ^ T * X是可逆的。在这种情况下,将只有一个解决方案。并且如果X没有完整的列排名,那么X ^ T * X将不会完整列,因此您的系统将不确定。


1
这些话似乎并没有解决这个问题:不管的排名如何,仍然存在一个解决方案。例如,考虑极端情况,其中是全零的矩阵。然后,正规方程简化为,任何都是解。X 0 β = 0 βXXX0β=0 β
whuber

笨拙的:当然,他们解决了这个问题:如果X是完整的列级(如我所提到的),则一个解决方案;如果它是一个不确定的系统,则一个无限的解决方案
user542833 2013年

1
系统“不确定”的事实并不意味着它有任何解决方案。问题是解决方案的存在。
whuber
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.