如果模型中有一个常数项,则位于的列空间中(也会在后面有用)。拟合的是观察到的在由该列空间形成的平面上的正交投影。这意味着残差向量垂直于平面,因此垂直于。考虑点积,我们可以看到,因此的分量必须加和为零。由于我们得出以下结论: X ˉ ý 1 ñ Ŷ Ŷ ë = ÿ - ÿ 1 ñ Σ Ñ 我= 1 Ë 我 =0 Ë Ŷ 我 = ^ ÿ 我 + ë 我Σ Ñ 我= 1 Ÿ 我 = Σ Ñ 我= 1 ^ ÿ 我 ˉ ÿ1nXY¯1nY^Ye=y−y^1n∑ni=1ei=0eYi=Yi^+ei∑ni=1Yi=∑ni=1Yi^因此拟合和观察到的响应均具有均值。Y¯
图中的虚线代表和,它们是居中的向量观察和拟合的响应。的角度的余弦因此这些矢量之间的将是相关和,其定义为所述多个相关系数。这些向量与残差向量形成的三角形是直角的,因为位于平坦的位置,但是与该平面 正交。因此:ý - ˉ ý 1个ñ θ ý ý ř ý - ˉ ý 1 Ñ ËY−Y¯1nY^−Y¯1nθYY^RY^−Y¯1ne
R=cos(θ)=adjhyp=∥Y^−Y¯1n∥∥Y−Y¯1n∥
我们也可以将毕达哥拉斯应用于三角形:
∥Y−Y¯1n∥2=∥Y−Y^∥2+∥Y^−Y¯1n∥2
可能更熟悉如下:
∑i=1n(Yi−Y¯)2=∑i=1n(Yi−Y^i)2+∑i=1n(Y^i−Y¯)2
这是平方和的分解。SStotal=SSresidual+SSregression
测定系数的标准定义为:
R2=1−SSresidualSStotal=1−∑ni=1(yi−y^i)2∑ni=1(yi−y¯)2=1−∥Y−Y^∥2∥Y−Y¯1n∥2
当平方和可以被分割时,它需要一些简单的代数来表明这等同于“解释方差比”的表述,
R2=SSregressionSStotal=∑ni=1(y^i−y¯)2∑ni=1(yi−y¯)2=∥Y^−Y¯1n∥2∥Y−Y¯1n∥2
有一种从三角形中看到几何的方式,且代数最少。定义公式给出,使用基本三角函数可以将其简化为。这是和之间的链接。cos 2(θ )R 2 RR2=1−sin2(θ)cos2(θ)R2R
请注意,对于该分析而言,拟合一个截距项至关重要,因此 位于列空间中。没有这个,残差将不会加到零,并且拟合值的平均值也不会与的平均值一致。在这种情况下,我们无法绘制三角形。平方和不会以毕达哥拉斯的方式分解;不会具有经常被引用的形式也不是的平方。在这种情况下,某些软件(包括)总共对使用不同的公式。 Y R 2 S S reg / S S 合计 R R 21nYR2SSreg/SStotalRR
R2