多重相关系数和确定系数几何解释


24

我对回归的多重相关性和确定系数的几何含义感兴趣或矢量记号,RR2yi=β1+β2x2,i++βkxk,i+ϵi

y=Xβ+ϵ

这里的设计矩阵有行和列,其中第一个是,它是1s的向量,对应于截距。Xnkx1=1nβ1

在维主题空间而不是维变量空间中,几何更有趣。定义帽子矩阵:nk

H=X(XX)1X

这是的列空间上的正交投影,即 由代表每个变量的向量跨越的原点的平坦部分,其中第一个是。然后将观测到的响应投影到平面上的“阴影”上,拟合值的向量,如果沿着投影的路径看,我们会看到残差向量形成了三角形的第三边。这应该为我们提供两种途径来对进行几何解释Xkxi1nHý = ħ Ŷ ë = ÿ - ÿ - [R 2yy^=Hye=yy^R2

  1. 多重相关系数的平方,它定义为和之间的相关性。这将在几何上显示为角度的余弦。Rÿyy^
  2. 就矢量的长度而言:例如。SSresidual=i=1nei2=e2

我很高兴看到一个简短的说明,说明:

  • (1)和(2)的详细信息,
  • 为什么(1)和(2)等价,
  • 简而言之,几何学的见解如何使我们可视化R ^ 2的基本属性R2,例如为什么当噪声方差变为0时将R ^ 2变为1。(毕竟,如果我们不能从可视化中直观地看出,那么它仅是a美丽的照片。)

我知道如果变量首先居中,这会更直接,这可以消除问题中的截距。但是,在大多数引入多元回归的教科书中,设计矩阵X就像我所列出的那样。当然,如果一个博览会深入到中心变量所跨越的空间,那是很好的,但是为了深入了解教科书的线性代数,将其与无中心情况下的几何变化联系起来非常有帮助。一个真正有见地的答案可能会解释当截取项被删除时,即当向量\ mathbf {1} _n时,几何上到底发生了什么?1n已从生成集中删除。我认为最后一点不能仅通过考虑中心变量来解决。

Answers:


47

如果模型中有一个常数项,则位于的列空间中(也会在后面有用)。拟合的是观察到的在由该列空间形成的平面上的正交投影。这意味着残差向量垂直于平面,因此垂直于。考虑点积,我们可以看到,因此的分量必须加和为零。由于我们得出以下结论: X ˉ ý 1 ñ Ŷ Ŷ ë = ÿ - ÿ 1 ñ Σ Ñ = 1 Ë =0 Ë Ŷ = ^ ÿ + ë Σ Ñ = 1 Ÿ = Σ Ñ = 1 ^ ÿ ˉ ÿ1nXY¯1nY^Ye=yy^1ni=1nei=0eYi=Yi^+eii=1nYi=i=1nYi^因此拟合和观察到的响应均具有均值。Y¯

多元回归主题空间中的向量

图中的虚线代表和,它们是居中的向量观察和拟合的响应。的角度的余弦因此这些矢量之间的将是相关和,其定义为所述多个相关系数。这些向量与残差向量形成的三角形是直角的,因为位于平坦的位置,但是与该平面 正交。因此:ý - ˉ ý 1个ñ θ ý ý ř ý - ˉ ý 1 Ñ ËYY¯1nY^Y¯1nθYY^RY^Y¯1ne

R=cos(θ)=adjhyp=Y^Y¯1nYY¯1n

我们也可以将毕达哥拉斯应用于三角形:

YY¯1n2=YY^2+Y^Y¯1n2

可能更熟悉如下:

i=1n(YiY¯)2=i=1n(YiY^i)2+i=1n(Y^iY¯)2

这是平方和的分解。SStotal=SSresidual+SSregression

测定系数的标准定义为:

R2=1SSresidualSStotal=1i=1n(yiy^i)2i=1n(yiy¯)2=1YY^2YY¯1n2

当平方和可以被分割时,它需要一些简单的代数来表明这等同于“解释方差比”的表述,

R2=SSregressionSStotal=i=1n(y^iy¯)2i=1n(yiy¯)2=Y^Y¯1n2YY¯1n2

有一种从三角形中看到几何的方式,且代数最少。定义公式给出,使用基本三角函数可以将其简化为。这是和之间的链接。cos 2θ R 2 RR2=1sin2(θ)cos2(θ)R2R

请注意,对于该分析而言,拟合一个截距项至关重要,因此 位于列空间中。没有这个,残差将不会加到零,并且拟合值的平均值也不会与的平均值一致。在这种情况下,我们无法绘制三角形。平方和不会以毕达哥拉斯的方式分解;不会具有经常被引用的形式也不是的平方。在这种情况下,某些软件(包括)总共使用不同的公式 Y R 2 S S reg / S S 合计 R R 21nYR2SSreg/SStotalRRR2


1
+1非常好的写作和人物。我很惊讶它只有我一个人孤单。
变形虫说恢复莫妮卡2014年

2
+1。请注意,答案的图形以“列空间X”,“ Y”,“ Ypred”为向量等,在多元统计中称为“(缩减的)主题空间表示形式”(请参见,在我使用过的地方还有其他链接) )。
ttnphns
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.