对于任何 数字,均值
,方差由
应用对于给定的数字
,为了便于说明,我们使它们具有均值,
Ny1,y2,…,yNy¯=1N∑i=1Nyi
σ2σ2=1N−1∑i=1N(yi−y¯)2=1N−1∑i=1N(y2i−2yiy¯+y¯2)=1N−1[(∑i=1Ny2i)−2N(y¯)2+N(y¯)2]=1N−1∑i=1N(y2i−(y¯)2)(1)
(1)nx1,x2,…xnx¯=0σ2=1n−1∑i=1n(x2i−(x¯)2)=1n−1∑i=1nx2i
如果现在向该数据集添加新的观测值,则数据集的新均值是
而新的方差是
所以需要大于
xn+11n+1∑i=1n+1xi=nx¯+xn+1n+1=xn+1n+1
σ^2=1n∑i=1n+1(x2i−x2n+1(n+1)2)=1n[((n−1)σ2+x2n+1)−x2n+1n+1]=1n[(n−1)σ2+nn+1x2n+1]>σ2 only if x2n+1>n+1nσ2.
|xn+1|σ1+1n−−−−−√
或更笼统地说,与原始数据集的均值的差异应大于,以便使扩充后的数据集具有比原始数据集更大的方差。另请参阅雷·库普曼(Ray Koopman)的答案,该答案指出,根据的新方差大于,等于或小于原始方差,与均方差
相差大于,等于或小于。
xn+1x¯σ1+1n−−−−−√xn+1σ1+1n−−−−−√