证明OLS估计量是尺度相等的吗?


11

我没有尺度等方差的正式定义,但是这是《统计学习入门》在p上对此的描述。217:

标准最小二乘系数...是等比例的:将乘以常数只会导致将最小二乘系数估计值按比例缩放。XĴC1个/C

为简单起见,我们假设通用线性模型,其中,是矩阵(其中),其中,和是具有的实值随机变量的维向量。- [R β &Element; [R p + 1 ε Ñ ë [ ε ] = 0 Ñ × 1ÿ=Xβ+ϵÿ[RñXñ×p+1个p+1个<ñ[Rβ[Rp+1个ϵñË[ϵ]=0ñ×1个

根据OLS估算,我们知道如果具有完整(列)排名,则 假设我们相乘的一个列,说一些,通过常数。这相当于矩阵 β X = X Ť X - 1 X Ť ÿX X ķ ķ { 1 2 ... p + 1 } Ç 0 X [ 1X

β^X=XŤX-1个XŤÿ
XXķķ{1个2p+1个}c0š0Çķ小号XXβX= X ŤX-1XŤÿXŤX=[X Ť 1
X[111c11]S=[x1x2cxkxp+1]X~
,其中矩阵所有其他条目均为,并且在对角线的第个条目中。然后,S0ckSX~X~因为新的设计矩阵是 经过一番努力,人们可以证明
β^X~=(X~TX~)1X~Ty.
XŤX=[X1个ŤX1个X1个ŤX2CX1个ŤXķX1个ŤXp+1个X2ŤX1个X2ŤX2CX2ŤXķX2ŤXp+1个CXķŤX1个CXķŤX2C2XķŤXķCXķŤXp+1个Xp+1个ŤX1个Xp+1个ŤX2CXp+1个ŤXp+1个Xp+1个ŤXp+1个]
\ cdots和\ mathbf {x} _ {p + 1} ^ {T} \ mathbf {x} _ {p + 1} \\ \ end {bmatrix} 和
XŤÿ=[X1个ŤÿX2ŤÿCXķŤÿXp+1个Ťÿ]
我如何从此处显示上面引用的声明(即)?我不清楚如何计算。X ŤX-1β^X=1个Cβ^XXŤX-1个

我认为您的是不正确的,它在整行中都缺少乘法器。 ÇXŤXC
Firebug

1
另外,请记住声明是,而不是每个。ββ^ķ=1个Cβ^ķβ
Firebug

@Firebug是的,我只是想通了。我正在发布答案。
单簧管手

2
可以更换所有通过简单得多的单位分析该代数,因为乘以由仅仅改变其测量的单元,因此,在与它的系数相关联的单元的相应变化是通过将其分摊。不幸的是,这并不能证明必须除以。但是,这种思路可能会提醒我们,可以通过一次对一个回归变量进行一系列回归来执行多重回归,很明显,除以,因此证明是完整的。 ç β Ĵ ç β Ĵ ç β Ĵ çXĴCβĴCβ^ĴCβ^ĴC
ub

@whuber,虽然对结果的直觉很清楚,但在提供证明时似乎必须有一点代数。毕竟,比例因子需要反转。C
user795305 2017年

Answers:


11

由于引号中的断言是有关重新缩放列的语句的集合,因此您不妨一次证明它们。确实,无需做更多工作即可证明该断言的一般性:X

当与可逆矩阵右乘时,则新系数估计等于左乘以。ββ- 1X一种β^一种β^一种-1个

对于唯一的矩阵和,您唯一需要的代数事实是的(容易证明的,众所周知的事实为可逆矩阵和。(使用广义逆时,需要后者的更微妙的形式:对于可逆和以及任何,。 )- 1 = - 1- 1X X - = - 1 X -- 1一种=一种一种一种-1个=-1个一种-1个一种一种X一种X-=-1个X-一种-1个


代数证明

β^一种=X一种X一种-X一种ÿ=一种-1个XX-一种-1个一种ÿ=一种-1个β^

QED。 (为了使该证明完全通用,上标指的是广义逆。)-


几何证明

给定碱基和的和,分别表示从线性变换到。与右乘可被视为使此变换固定不变,但将更改为(即更改为的列)。在这种基础变化下,任何矢量必须通过与左乘法来改变,Ë ñ - [R ñ - [R p X - [R p - [R Ñ X é pé pβ&Element; [R p - 1ËpËñ[Rñ[RpX[Rp[RñX一种Ëp一种Ëp一种β^RpA1QED

(即使是不可逆的,该证明也可以有效地使用,但不会修改。)XX


引用具体指的是对且的对角矩阵为的情况。A i i = 1 i j A j j = cAAii=1ijAjj=c


最小二乘连接

这里的目的是使用第一原理来获得结果,该原理是最小二乘法:估计使残差的平方和最小的系数。

再次证明,证明(巨大的)概括不再困难,而只是揭示而已。 假设是实向量空间的任何映射(线性或非线性),并且是上的任何实值函数。让是点的(可能为空)为其中被最小化。 Q W¯¯ Ñ ù V p v Q φ v

ϕ:VpWn
QWnUVpvQ(ϕ(v))

结果: 仅由和确定的不依赖于用于表示向量的基础任何选择。Q ϕ E p V pUQϕEpVp

证明: QED。

没有什么可证明的!

结果的应用:令为上的正半定二次型,令,并假定是当为时由表示的线性映射和。定义。选择一个的基础,并假设是该基础上某些的表示。 这是最小二乘:最小化平方距离。因为ř Ñ ý [R Ñ φ X V p = - [R p w ^ Ñ = - [R Ñ Q X = ˚F Ý X - [R p β v Ù X = X β ˚F Ý X X - [R p X β- 1FRnyRnϕXVp=RpWn=RnQ(x)=F(y,x)Rpβ^vUx=Xβ^F(y,x)X是线性图,改变的基础对应于右乘以由一些可逆矩阵。将左乘由,QEDRpXAβ^A1


6

定义最小二乘估计器,其中设计矩阵是满分。假设缩放矩阵是可逆的。 X[RÑ×p小号[Rp×pβ^=argminβRpyXβ22XRn×pSRp×p

定义此新的缩放估算器。这意味着对于所有。限定,我们可以重写该显示上述不等式为为所有。因此,得出最小二乘估计量 由于缩放矩阵的可逆性ý-X小号α 2 2 <ý-X小号α 2 2 αα β =小号αÿ-Xβ 2 2 <ÿ-α~=argminαRpyXSα22

ÿ-X小号α22<ÿ-X小号α22
ααβ=小号α β β β = ARG 分钟β &Element; [R pý - X β 2 2 β = β = 小号α小号α = 小号- 1 β β ķ ħ 1
ÿ-Xβ22<ÿ-Xβ22
βββ~=argminβRpyXβ22
β^=β~=Sα~.
S,则。在我们的情况下,这与的唯一不同之处在于项由缩放。α~=S1β^β^kth1c

1
我不熟悉使用和类似函数的方法-您能解释一下从第二行到第三行的转换吗?精氨酸
单簧管

我写的有点不同,这应该使步骤更清晰。
user795305 '17

这真的很聪明。(+1)
单簧管手

4

发布问题后,我想出了这一点。但是,如果我的工作是正确的,我会误解该索赔。所述仅缩放发生的一个部件上对应的列乘以。 βXÇ1个CβXC

请注意,上面的符号是对角对称矩阵,并且具有逆矩阵(因为它是对角线) 请注意是矩阵。假设 p + 1 × p + 1 S 1 = [ 1小号p+1个×p+1个X ŤX-1p+1×p+1XŤX-1=[ Ž 1个ž 2Ž ķŽ p + 1 ]X ŤX-1=[X小号

小号-1个=[1个1个1个1个C1个1个]
XŤX-1个p+1个×p+1个
XŤX-1个=[ž1个ž2žķžp+1个]
XŤX-1个=[X小号ŤX小号]-1个=小号ŤXŤX小号-1个=小号XŤX小号-1个=小号-1个XŤX-1个小号-1个
因此, 并将其乘以与将乘以效果相似-保持不变,乘以
小号-1个XŤX-1个=[ž1个ž21个Cžķžp+1个]
小号-1个X小号1个Cžķ1个C: 因此,
小号-1个XŤX-1个小号-1个=[ž1个ž21个C2žķžp+1个]
β^X=小号-1个XŤX-1个小号-1个X小号Ťÿ=[ž1个ž21个C2žķžp+1个][X1个ŤÿX2ŤÿCXķŤÿXp+1个Ťÿ]=[ž1个X1个Ťÿž2X2Ťÿ1个CžķXķŤÿžp+1个Xp+1个Ťÿ]

有一个错字在。您需要转置。小号-1个XŤX-1个小号-1个X小号ÿX小号
JohnK

3

有史以来最琐碎的证明

您从线性方程式开始: 现在,您想更改回归器的比例,也许从公制转换为英制,您知道千克到磅,米到码等。所以,您来转换矩阵为,其中每个是设计矩阵变量(列)的转换系数。

ÿ=Xβ+ε
小号=d一世一种Gs1个s1个sñs一世一世X

让我们重新编写方程:

ÿ=X小号小号-1个β+ε

现在已经很清楚,比例缩放是方程式线性的属性,而不是系数估计的OLS方法。无论采用线性方程式的估算方法如何,您都可以将回归系数缩放为新系数应该缩放为X小号小号-1个β

代数证明仅适用于OLS

缩放比例是这样的: 其中每个变量(列)的比例因子,是的缩放版本。我们称对角线比例矩阵。您的OLS估计器是 让我们插入缩放的矩阵而不是并使用一些矩阵代数: 因此,您将看到新系数只是简单地按预期比例缩小了旧系数。

ž=Xd一世一种Gs1个s2sñ
s一世žX小号d一世一种Gs1个s2sñ
β^=XŤX-1个XŤÿ
žX
žŤž-1个žŤÿ=小号ŤXŤX小号-1个小号ŤXŤÿ=小号-1个XŤX-1个小号-1个小号XŤÿ=小号-1个XŤX-1个XŤÿ=小号-1个β^

2
我喜欢您的方法,但是对“有史以来最琐碎的证据”感到不服。您已经隐含地假设,并且仍然需要证明,重写的模型必须与原始模型具有相同的拟合度。更严格地说:如果我们将拟合过程视为函数,其中是所有可能数据的集合(我们可以将其写为有序对),是所有可能系数估计的集合,那么您需要证明为所有可逆,所有,以及所有。(这并不总是正确的!)δ中号[Rp中号Xÿ[RpδXÿ=小号-1个δX小号ÿ小号Xÿ
whuber

@whuber,实际上是另一种方式:合理的拟合过程应满足此条件,否则,简单地更改度量单位将产生不同的预测/估计。我会更新我的答案,会去想它一点点
Aksakal

我同意-但是我可以想象在以下情况下的例外情况 X排名不完整。这就是给我的提示,这种情况并不像看起来那样琐碎。
豪伯

3
皇室成员,不是皇家 ...:D(很好的回答,+ 1)
usεr11852

@usεr11852,我今天学到了一些东西:)
Aksakal

2

ÿ^ÿX β^是表示为线性时系数的向量列的组合。如果某列按因子缩放,则很明显,线性组合中的相应系数必须按缩放。ÿ^XC1个/C

假设是的值,而是用缩放一列时的OLS解决方案的值b一世β^一种一世C

b1个X1个++b一世X一世++bX=一种1个X1个+一种一世CX一世++一种ñXñ

表示bĴ=一种Ĵ,假设的列是线性独立的其中和。Ĵ一世b一世=一种一世CX

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.