Answers:
相似之处不只是表面上的。
“偏差-方差折衷”可以解释为应用于两个垂直欧几里得向量的毕达哥拉斯定理:一个的长度是标准偏差,另一个的长度是偏差。斜边的长度是均方根误差。
作为出发点,请考虑一下该揭示性计算,该计算对于具有有限第二矩和任何实数a的任何随机变量有效。由于第二矩是有限的,因此X具有有限的均值μ = E(X ),其中E(X - μ )= 0,因此
这示出了如何之间的平均平方偏差和任何“基线”值一个与变化一个:它是一个二次函数一个具有最小在μ,其中,所述均方偏差为的方差X。
任何估计θ是一个随机变量,因为(根据定义)是随机变量的(可测量)函数。让它扮演X在前面,并让estimand(东西θ应该估计)是θ,我们有
现在让我们回到,我们已经看到有关估计量的偏倚+方差的陈述实际上是(1 )的情况。这个问题寻求“与数学对象的数学类比”。通过证明平方可积分随机变量可以自然地构成一个欧几里得空间,我们可以做更多的事情。
在非常普遍的意义,一个随机变量是在概率空间中的(可测量的)实值函数。平方可积的此类函数集(通常写为L 2(Ω )(理解给定的概率结构))几乎是希尔伯特空间。 将它做成一个,我们要混为一谈任何两个随机变量X和Ÿ不真正在整合方面有所不同:那就是,我们说X和Y ^是等价每当
这是简单的检查,这是一个真正的等价关系:最重要的是,当相当于Ÿ和Ÿ相当于ž,则必然X将相当于ž。因此,我们可以将所有平方可积分随机变量划分为等价类。这些类别形成集合L 2(Ω )。此外,大号2继承了矢量空间的结构大号 2通过逐点加法值和逐点标量乘法的定义。在这个向量空间上,函数
是一种规范,经常写成。该范数使L 2(Ω )成为希尔伯特空间。 将希尔伯特空间H视为“无限维欧几里德空间”。任何有限维子空间V ⊂ ^ h继承规范^ h和V,与此规范,是欧氏空间:我们可以在它做欧几里德几何。
最后,我们需要一个事实,它对于概率空间(而不是一般的度量空间)来说是特殊的:因为是一个概率,所以它被(1)限制,因此常数函数ω → a(对于任何固定的实数a)为具有有限范数的平方可积随机变量。
考虑任何平方可积分的随机变量,它被认为是L 2(Ω )中其等价类的代表。它有一个平均值μ = E(X ),它(可以检查)仅取决于X的等价类。令1:ω → 1为常数随机变量的类别。
和 1产生的欧几里德子空间 V ⊂ 大号2(Ω ),其尺寸为至多 2。在此子空间中, | | X | | 2 2 = E(X 2)是 X和 |的平方长度。| 一种是常数随机变量 ω → a的平方长度。 这是最基本的 X - μ 1是垂直于 1。 (对 μ的一个定义是,它是这种情况的唯一数字。)关系式(1 )可以写成
这确实是恰恰勾股定理,基本上2500年前称为相同的形式。对象是与腿直角三角形的斜边X - μ 1和(一- μ )1。
如果您想进行数学类比,则可以使用任何可以根据欧几里得空间中直角三角形的斜边来表示的东西。斜边将代表“误差”,而支腿将代表偏差和与均值的偏差。
这是一种直观地考虑准确性和方差偏差的方法。假设您正在注视目标,并且您拍摄的许多镜头都散布在目标中心附近,且没有偏差。然后,准确度仅由方差确定,当方差较小时,射手是准确的。
现在让我们考虑一个精度很高但偏差较大的情况。在这种情况下,镜头散布在远离中心的位置。某个东西弄乱了目标点,但围绕该目标点,每一次射击都接近该新目标点。射手精准但由于偏见而非常不准确。
在其他情况下,由于偏差小和精度高,因此拍摄的照片准确。我们想要的是没有偏差,小方差或具有小偏差的小方差。在某些统计问题中,不能同时兼有。因此,MSE成为您要使用的精度的度量标准,以抵消方差偏差,而将MSE减至最小应该是目标。