线性回归中w的闭合形式后面的直觉


10

线性回归中w的闭合形式可以写成

w^=(XTX)1XTy

我们如何直观地解释在此等式中的作用?(XTX)1


2
您能否详细说明“直觉”的含义?例如,在克里斯滕森的《复杂问题平面答案》中,关于内积空间有一个非常直观的解释但是并不是每个人都会喜欢这种方法。再举一个例子,我在stats.stackexchange.com/a/62147/919的回答中有一个几何解释,但并非所有人都认为几何关系是“直观的”。
ub

直观地就像$(X ^ TX)^ {-1}是什么意思?是某种距离计算还是什么,我听不懂。
Darshak '18年

1
我链接到的答案对此做了充分解释。
ub

这个问题已经在这里虽然有可能不存在一个令人满意的答案math.stackexchange.com/questions/2624986/...
塞克图斯经验派

Answers:


5

我发现这些帖子特别有帮助:

如何导出多元线性回归的最小二乘估计?

SVD与PCA之间的关系。如何使用SVD执行PCA?

http://www.math.miami.edu/~armstrong/210sp13/HW7notes.pdf

如果n × p矩阵,则矩阵X X T X 1 X T定义到X的列空间上的投影。直观地说,你有方程的超定系统,但仍希望用它来定义线性图[R p[R将映射行X X到了接近值Ÿ { 1 ... ñ }Xn×pX(XTX)1XTXRpRxiXyii{1,,n}。因此,我们决定将发送到与y最接近的事物,该事物可以表示为要素的线性组合(X的列)。 XyX

至于的解释,我还没有一个惊人的答案。我知道您可以认为X T X 本质上是数据集的协方差矩阵。(XTX)1(XTX)


有时也称为“散度矩阵”,并且只是协方差矩阵的按比例放大版本(XTX)
JacKeown

4

几何观点

几何观点可以像n维矢量X β在n维空间被分V。其中X β也是在子空间W¯¯由矢量所跨越X 1X 2X yXβVXβ^Wx1,x2,,xm

投影

两种坐标

对于这个子空间我们可以想象两种不同类型的坐标W

  • β是像一个普通坐标空间的坐标。向量在空间W¯¯是这些矢量的线性组合X Ž = β 1 X 1 + β 2 X 1 + β x zWxi
    z=β1x1+β2x1+....βmxm
  • α不是常规意义上的坐标,但他们定义的子空间的一个点。每个α 到涉及垂直凸起到矢量X 。如果我们用单位矢量X (为简单起见),则“坐标” α 用于向量Ž可以表示为:Wαixixiαiz

    αi=xiTz

    所有坐标的集合为:

α=XTz

坐标β之间的映射αβ

对于的“坐标”的表达α从坐标变为转换β为“坐标” αz=Xβαβα

α=XTXβ

您可以看到表示每个x i投射到另一个x j上的数量(XTX)ijxixj

然后的几何解释可以被看作是从矢量投影“坐标”在地图α为线性坐标β(XTX)1αβ

β=(XTX)1α

表达式给出的投影“坐标” ÿX Ť X - 1把它们变成βXTyy(XTX)1β


:的投影“坐标” 是相同的投影“坐标” Ÿ因为Ÿ - ŸXy y^(yy^)X



确实非常相似。对我来说,这种观点是非常新颖的,我不得不花一个晚上考虑一下。我一直都以投影的形式查看最小二乘回归,但是从这个角度来看,我从未尝试实现对零件X T X 1的直观含义,或者我总是在更间接的表达式X T y = X中看到它。牛逼 X β(XTX)1XTy=XTXβ
Sextus Empiricus

3

假设你熟悉简单线性回归: 和其溶液β = Ç ö v [ X ÿ ]

yi=α+βxi+εi
β=cov[xi,yi]var[xi]

可以很容易地看到对应于上述分子和X ' X映射到分母。由于我们要处理矩阵,因此顺序很重要。X ' X就是KXK矩阵,和X ' ÿ是KX1矢量。因此,顺序为:X ' X - 1 X ' ÿXyXXXXXy(XX)1Xy


但是,这种类比本身并不能告诉您该乘积是乘逆运算的。
kjetil b halvorsen

@kjetilbhalvorsen,我下达了作业命令
Aksakal)'18
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.