是的,您应该期望两个示例(未加权与加权)都能得到相同的结果。
我已经实现了Wikipedia文章中的两种算法。
这个作品:
如果所有xi均来自同一分布,并且整数权重wi表示样本中的出现频率,则加权总体方差的无偏估计量如下:
s2 =1V1−1∑Ni=1wi(xi−μ∗)2,
但是,这个(使用分数权重)对我不起作用:
如果每个xi是从方差为1/wi的高斯分布中得出的,则加权总体方差的无偏估计量为:
s2 =V1V21−V2∑Ni=1wi(xi−μ∗)2
我仍在调查第二个方程无法按预期工作的原因。
/ EDIT:找到了第二个方程式不起作用的原因:只有当您具有归一化的权重或方差(“可靠性”)权重时,才可以使用第二个方程式,并且它不是无偏的,因为如果您没有使用“重复”权重(计数观察值的次数,因此应该在数学运算中重复进行计数),您将无法计算观察值的总数,因此无法使用校正因子。
因此,这解释了使用加权和非加权方差的结果差异:您的计算有偏差。
因此,如果您想拥有一个无偏加权方差,请仅使用“重复”权重并使用我上面发布的第一个等式。如果这不可能,那么您将无能为力。
如果您需要更多信息,我也更新了Wikipedia的文章:http :
//en.wikipedia.org/wiki/Weighted_arithmetic_mean#Weighted_sample_variance
以及有关无偏加权协方差(由于极化标识而实际上是相同的方差)的链接文章:
加权无偏样本协方差的正确方程式