@NRH对这个问题的答案很好地证明了样品标准偏差的偏差。在这里,我将明确地从正态分布的样本中计算出样本标准差的期望值(原始张贴者的第二个问题),此时偏差是显而易见的。
一组点的无偏样本方差为x1,...,xn
s2=1n−1∑i=1n(xi−x¯¯¯)2
如果是正态分布的,则事实是xi
(n−1)s2σ2∼χ2n−1
其中是真实方差。所述分布具有的概率密度χ 2 ķσ2χ2k
p(x)=(1/2)k/2Γ(k/2)xk/2−1e−x/2
使用此可以得出的期望值;s
E(s)=σ2n−1−−−−−√E(s2(n−1)σ2−−−−−−−−√)=σ2n−1−−−−−√∫∞0x−−√(1/2)(n−1)/2Γ((n−1)/2)x((n−1)/2)−1e−x/2 dx
从期望值的定义和是分布变量的平方根的事实出发。现在的技巧是重新排列项,以使被积数成为另一个密度:s2(n−1)σ2−−−−−−√χ2χ2
E(s)=σ2n−1−−−−−√∫∞0(1/2)(n−1)/2Γ(n−12)x(n/2)−1e−x/2 dx=σ2n−1−−−−−√⋅Γ(n/2)Γ(n−12)∫∞0(1/2)(n−1)/2Γ(n/2)x(n/2)−1e−x/2 dx=σ2n−1−−−−−√⋅Γ(n/2)Γ(n−12)⋅(1/2)(n−1)/2(1/2)n/2∫∞0(1/2)n/2Γ(n/2)x(n/2)−1e−x/2 dxχ2n density
现在我们知道被积数的最后一行等于1,因为它是密度。简化常量可以得到 χ2n
E(s)=σ⋅2n−1−−−−−√⋅Γ(n/2)Γ(n−12)
因此的偏差为s
σ−E(s)=σ(1−2n−1−−−−−√⋅Γ(n/2)Γ(n−12))∼σ4n
作为。
n→∞
不难看出,对于任何有限的,该偏差都不为0 ,因此证明了样本标准偏差是有偏差的。下面的偏压是情节作为的函数为在红色与沿在蓝色:nnσ=11/4n