回归系数的偏差方差折衷是什么?如何推导?


9

本文中(仅使用误差对比度进行方差分量的贝叶斯推断,Harville,1974年),作者声称 成为“众所周知的线性回归 其中

ÿ-XβH-1个ÿ-Xβ=ÿ-Xβ^H-1个ÿ-Xβ^+β-β^XH-1个Xβ-β^
ε ñ
y=Xβ+ϵ,
ϵN(0,H).

这个怎么知名的?证明这一点的最简单方法是什么?


1
它在Wikipedia上,请参阅“派生”。
user603 2015年

@ user603您介意使链接更清晰吗?谢谢!
锡伯斯赌博

@ user603抱歉,我真的看不到链接如何解决问题。对我而言,等式为Var(y)= bias + ...您能详细说明吗?
锡伯斯赌博

4
@SibbsGambling注意,在这种加权线性回归公式中,您的方程式包含两个与方差相关的项。左边的项与真实模型周围的方差有关(由精度矩阵加权)。右边的第一项与拟合模型周围的方差有关。右边的第二项与偏差的平方有关。这就是方差偏见的权衡。H1
EdM 2015年

Answers:


6

等式中的最后一项可以写成

(XβXβ^)H1(XβXβ^).

在这种形式下,方程式表达了一些有趣的意思。假设为正定且对称,则为逆。因此,我们可以定义一个内积,给我们几何形状。那么上述等式实际上就是在说 < X ÿ > ħ - 1 = X ' ħ - 1个 Ÿ X β - X βÝ - X βH<Xÿ>H-1个=XH-1个ÿ

Xβ-Xβ^ÿ-Xβ^

我想给你一些直觉,因为评论者已经离开了派生链接。

编辑:为后代

LHS:

ÿ-XβH-1个ÿ-Xβ=ÿH-1个ÿ-2ÿH-1个Xβ+βXH-1个Xβ=一个-+C

RHS:

ÿ-Xβ^H-1个ÿ-Xβ^+β-β^XH-1个Xβ-β^
=ÿH-1个ÿ-2ÿH-1个Xβ^+β^XH-1个Xβ^+βXH-1个Xβ-2β^XH-1个Xβ+β^XH-1个Xβ^=一个-d+Ë+C-F+Ë

关系:

β^=XH-1个X-1个XH-1个ÿ

通过插入关系,您可以显示(B)=(F),并且2(E)=(D)。全做完了。


抱歉,我真的看不到链接如何解决问题。对我而言,等式为Var(y)= bias + ...您能详细说明吗?
锡伯斯赌博

@SibbsGambling编辑了我的答案,包括推导。
jlimahaverford

@jlimahaverford您是否不会忘记公式结尾的?βÿβ^
Gumeo 2015年

7

他们通过一种称为完成正方形的技术来获得此身份。左侧为二次形式,因此先将其相乘

ÿ-XβH-1个ÿ-Xβ=ÿH-1个ÿ-2ÿH-1个Xβ+βXH-1个Xβ

继续,然后根据。代数有点长,但是在贝叶斯回归中完成了平方运算,因此您可以找到很多提示。例如,请参阅有关贝叶斯线性回归的维基百科,以及有关完成正方形的其他CrossValided答案,例如此处β^=XH-1个X-1个XH-1个ÿ


2

如果您知道矩阵代数,则可以通过将所有内容相乘并验证双方确实相同来实现。这就是jlimahaverford所展示的。

为此,您需要使用的估算公式。当我们具有不相关的误差项时,我们可以采用与线性回归类似的方式来推导公式。诀窍是要标准化。β^

以下是有关如何标准化来自多元正态分布的RV的一些信息。假设您有 是正定的,所以可以因式分解它作为。现在随机变量 来自分布。现在,我们可以使用此技巧解决问题,找到。让我们比化。我们有 现在已标准化,因此&Sigma; &Sigma; = P P Ť Ŷ = P - 1X - μ Ñ0 β ħ = P P Ť ÿ

XñμΣ
ΣΣ=PPŤ
ÿ=P-1个X-μ
ñ0一世β^H=PPŤ
ÿ=Xβ+ϵP-1个ÿ=P-1个Xβ+P-1个ϵ
ϵ冠状病毒P-1个ϵ=一世,因此我们现在可以将其视为简单的多元线性回归模型,其中: 因此,我们有回归问题: 对式是 这是要做的关键剩下的就是jlimahaverford解决方案中展示的代数运算。
X=P-1个Xÿ=P-1个ÿϵ=P-1个ϵ
ÿ=Xβ+ϵ
β^
β^=XŤX-1个XŤÿ=P-1个XŤP-1个X-1个P-1个XŤP-1个ÿ=XŤPPŤ-1个X-1个XPPŤ-1个ÿ=XŤH-1个X-1个XH-1个ÿ
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.