为什么我们不使用加权算术平均值而不是谐波平均值?


12

我想知道使用谐波均值(例如,计算F值)相对于组合精度和查全率的加权算术平均数的内在价值是什么?我认为加权算术平均值可能会起到谐波均值的作用,还是我错过了一些东西?


9
调和平均值加权算术平均值:每个的权重与成正比。X一世1个/X一世2
ub

您能否详细说明这种方式如何将精确度和召回率结合在一起?
AdamO

6
@whuber不确定您的评论是认真的还是嘲讽的。通常假定权重是样本索引的函数,而不是样本值的函数。否则,任何均值都是加权算术均值
Luis Mendo

2
@路易斯真相介于两者之间。样本索引通常是没有意义的。权重是对象的功能,但是这些功能通常不依赖于取平均值。例如与时间(EWMA),位置(如空间相关性度量),等级(如Shapiro-Wilk检验)和采样概率相关的权重。但是,并非所有均值都是加权AM:例如,GM不是。由于Filippa询问“内在价值”,指出谐波均值和加权均值之间的数学关系似乎很贴切。
ub

Answers:


18

通常,在尝试平均速率而不是整数时,最好使用谐波均值。对于F1量度,谐波均值将惩罚很小的精度或召回率,而未加权的算术均值则不会。想象一下平均为100%和0%:算术平均值为50%,谐波平均值为0%。谐波平均值要求精度和查全率都很高。

另外,当精度和查全率接近时,谐波平均值将接近算术平均值。示例:95%和90%的谐波平均值为92.4%,而算术平均值为92.5%。

这是否是理想的属性可能取决于您的用例,但是通常认为它是好的。

最后,请注意,正如@whuber在评论中所述,谐波均值的确是加权算术平均值。


2
“当一个人试图以平均利率谐波手段是首选” 也许,如果你的旅行公里出在120公里/小时和10公里处回60公里/小时来获得的平均整体速度80,如果你公里/小时,虽然没有行进10在分钟120公里/小时,10在分钟60公里/小时获得的平均总速度90公里/小时 但我不明白为什么这适用于分数1012010608010120106090
亨利

实际上,第一段更多地是关于谐波均值的一般性陈述。但是您说的没错,精确度和召回率只是分数,而不是比率。我相信有一种观点认为,对于具有可解释的总和的值(在这种情况下将不适用),首选算术平均值,但是可以肯定的是,可以对精度进行算术平均并取回并输出有用的结果。
ilanman

优秀的!我正在寻找使用谐波平均规则的“合理性”。但我不确定如何考虑
合理性。.– olga

10

当算术平均值没有期望或没有方差时,谐波平均值可以代替算术平均值。确实可能是不存在或为无限,而E [ 1 / X ]存在。例如,对于密度Pareto分布˚F X = α X α 0Ë[X]Ë[1个/X]无有限期望当α1,这意味着该算术平均值具有无限的期望,而ë[1/X]=∫ X 0 αX α 0

FX=αX0αXα+1个一世XX0
α1个表示谐波均值具有有限期望。
Ë[1个/X]=X0αX0αXα+2dX=αX0αα+1个X0α+1个=αα+1个X0

相反地,存在的量,调和平均数并没有期待,作为实例的贝塔分布分布时α 1。还有很多,它没有变化。Ëαβα1个

贝叶斯后验恒等式,其中φ是任何密度,π是先验的,L|x可能性,m是边际的,正如关于X的另一个问题所讨论的那样,其中I评论使用Radford Neal(美国多伦多大学)所谓的有史以来最糟糕的蒙特卡洛估计量的危险。(我还在我的博客上写关于该主题的多个条目。)

Ë[φθπθ大号θ|X|X]=1个X
φπ大号|X

2
为什么平均速率时这些属性更可取?
海象猫

我不知道最优结果,但是拥有一个期望值有限的估计器似乎比没有估计器更好!
西安
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.