令为观察数,为解释变量数。钾NK
ñX实际上是矩阵。仅当我们查看单个观测值时,我们通常将每个观测值表示为一个特定观测值标量的解释变量的行向量乘以列向量。此外,是列向量,其中包含所有观察值。N×KxTiK×1βYN×1Yn
现在,二维超平面将跨越向量和一个(!)列向量。请记住,是一个矩阵,因此每个解释变量均由矩阵一个列向量表示。如果我们只有一个解释变量,没有截距和,则所有数据点都位于由和跨越的二维平面上。YXXN×KXYYX
对于多元回归,和矩阵之间的超平面总共有多少维?答案:由于具有解释变量的列向量,因此必须具有维超平面。YXKXK+1
通常,在矩阵设置中,回归需要恒定的截距,以便合理地分析斜率系数。为了适应这一技巧,我们强制矩阵一列仅由“ s”组成。在这种情况下,估算器单独乘以每个观察值的常数,而不是随机的解释变量。因此,给定固定为值1且所有其他变量均为零,系数表示的期望值。因此,将维超平面缩小一维,成为维子空间,并且X1β1β1Yx1iK+1Kβ1对应于此维平面的“截距” 。K
在矩阵设置中,始终建议您看一下二维的简单情况,以查看是否可以为我们的结果找到直觉。在这里,最简单的方法是考虑具有两个解释变量的简单回归:
或用矩阵代数表示:其中是a矩阵。
yi=β1x1i+β2x2i+ui
Y=Xβ+uXN×2
<Y,X>跨越3维超平面。
现在,如果我们将所有都设为,我们将得到:
,这是我们通常的简单回归,可以用二维图表示。请注意,现在简化为二维线-原始3维超平面的子集。系数对应于处的线截距。x11
yi=β1i+β2x2i+ui
X, Y<Y,X>β1x2i=0
可以进一步显示,当包含常量时,它还会通过。如果我们不考虑常数,那么回归超平面将总是微不足道地通过 -毫无疑问。这可以推广到多个维度,如稍后在推导时将看到的:
由于具有每个定义的最高等级,因此,因此如果我们忽略截距,则回归将通过原点。<0,β1><0,0>βX ý - X β = 0
(X′X)β=X′y⟹(X′X)β−X′y=0⟹X′(y−Xβ)=0.
Xy−Xβ=0
(编辑:我刚刚意识到,对于您的第二个问题,这与您书面反对包含或排除常数是完全相反的。但是,我已经在这里设计了解决方案,并且如果我错了,我将予以纠正。)
我知道回归的矩阵表示在开始时可能会很混乱,但最终在推导更复杂的代数时会大大简化。希望这个对你有帮助。