几何提供洞察力,而经典不等式则使人更容易获得严谨。
几何解
我们知道,从最小二乘几何,即是向量的正交投影数据到由常数向量生成的线性子空间上并且与(Euclidean)距离成正比在和 非负约束是线性的,距离是一个凸函数,因此必须在由约束确定的圆锥边缘上达到极限距离。该圆锥体是的正向正割线X=(X1,X2,...,XÑ)(1,1,...,1)σXX ˉ X。řÑX我σX/ ˉ X =√x¯=(x¯,x¯,…,x¯)x=(x1,x2,…,xn)(1,1,…,1)σxxx¯.Rn它的边缘是坐标轴,因此,紧随其后的是,除了一个,所有在最大距离处都必须为零。对于这样的一组数据,直接(简单)计算显示xiσx/x¯=n−−√.
利用经典不等式的解决方案
σx/x¯与其任何单调变换同时进行优化。鉴于此,让我们最大化
x21+x22+…+x2n(x1+x2+…+xn)2=1n(n−1n(σxx¯)2+1)=f(σxx¯).
(的公式可能看起来很神秘,直到您意识到它只是记录了将代数操作使其变成简单形式(即左侧)时要采取的步骤。)fσx/x¯
一个简单的方法始于Holder不等式,
x21+x22+…+x2n≤(x1+x2+…+xn)max({xi}).
(在这种简单的上下文中,这不需要特殊的证明:只需将每个项的一个因子替换为最大分量:显然平方和不会减少。通用项产生不等式的右侧。)x2i=xi×ximax({xi})max({xi})
因为都不全为xi0(这将使未定义),所以除以其和的平方即为有效,并给出等价的不等式σx/x¯
x21+x22+…+x2n(x1+x2+…+xn)2≤max({xi})x1+x2+…+xn.
因为分母不能小于分子(分子本身只是分母中的一项),所以右侧由值占据,只有当除一个都等于时才能实现1xi0。何处
σxx¯≤f−1(1)=(1×(n−1))nn−1−−−−−−−−−−−−−−−√=n−−√.
替代方法
因为都是非负的,并且不能总和为,值确定的概率分布上。为的总和写,我们认识到xi0p(i)=xi/(x1+x2+…+xn)F{1,2,…,n}sxi
x21+x22+…+x2n(x1+x2+…+xn)2=x21+x22+…+x2ns2=(x1s)(x1s)+(x2s)(x2s)+…+(xns)(xns)=p1p1+p2p2+…+pnpn=EF[p].
公理的事实是,概率不可能超过意味着该期望也不能超过,但是通过将除所有值都设置为来使它等于很容易,因此之一恰好是非零的。如以上几何解决方案的最后一行所述,计算变异系数。111pi0xi