从嘈杂的观察中确定真实均值


13

我有一大套形式的数据点(平均值,标准偏差)。我希望将其减少为单一(更好)的平均值,以及(希望)较小的标准偏差。

显然,我可以简单地计算,但是这没有考虑到某些数据点比其他数据点准确得多的事实。datameanN

简而言之,我希望对这些数据点进行加权平均,但不知道在标准偏差方面加权函数应该是什么。

Answers:


24

您寻找形式的均值μ线性估计量μ

μ^=i=1nαixi

其中是权重和X 是观测。目的是找到合适的权重值。让σ 真正的标准偏差X ,这可能会或可能不会有一致的估计标准偏差你可能有。假设观察结果是公正的;也就是说,他们的期望都等于平均值μ。在这些方面,我们可以计算该的期望μαixiσixiμμ^

E[μ^]=i=1nαiE[xi]=μi=1nαi

并且(假设不相关),该估计量的方差为xi

Var[μ^]=i=1nαi2σi2.

在这一点上,许多人要求估算器没有偏见。也就是说,我们希望其期望等于真实均值。这意味着权重必须合计为一。受此限制,通过最小化方差来优化估计器的精度(以均方误差衡量)。独特的溶液(用拉格朗日乘数或通过重新演绎几何情况作为距离最小化问题容易地获得)是权重必须是正比于1 / σ 2 αi1/σi2 求和对单位的限制将其值固定下来,从而产生

μ^=i=1nxi/σi2i=1n1/σi2

Var[μ^]=1i=1n1/σi2=1n(1ni=1n1σi2)1.

换句话说

1/n

σi


1
与此答案相关,也来自胡扯:stats.stackexchange.com/questions/9071/…–
亨利(Henry)

xi
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.