何时使用哪个“平均值”?


197

因此,我们有算术平均值(AM),几何平均值(GM)和谐波平均值(HM)。它们的数学公式以及相关的定型示例(例如,谐波均值及其在“速度”相关问题中的应用)也是众所周知的。

但是,一个始终让我着迷的问题是:“我如何确定在给定上下文中最适合使用哪种方式?” 必须至少有一些经验法则来帮助理解适用性,但是我遇到的最常见的答案是:“取决于”(但取决于什么?)。

这似乎是一个相当琐碎的问题,但是即使是高中课本也无法解释这个问题-它们仅提供数学定义!

与数学上的解释相比,我更喜欢英文的解释-简单的测试就是“您的妈妈/孩子会理解吗?”


20
这也许简化了,但是我一直使用范围和观测值。如果范围相同= AM(比较分数0-100,则为0-100),如果范围不同但观察值相同= GM(比较分数1-5,则为0-10),如果范围相同但观察值是不同的= HM(汽车在不同观测点处的速度,两个梯子的高度,其他“比率”)。
布兰登·贝特尔森

>“取决于”(但取决于什么?)取决于数据处理算法。
麦森

这不仅仅是使用哪种方法的选择。也可以选择使用哪种摘要统计信息来描述感兴趣的总体或过程。一个人不应该只需要一个数字来描述可能非常复杂的事物。
JimB

Answers:


160

这个答案的数学倾向可能比您想要的要大。

要认识到的重要一点是,所有这些手段都是伪装的算术平均

识别三种常用方法(算术,几何或谐波)中的哪一种(如果有的话)的重要特征是“正确”的意思是在眼前的问题中找到“加法结构”。

换句话说,假设我们得到了一些抽象量,我将它们称为“测量”,为保持一致性起见,在下面有点滥用此术语。通过(1)将每个转换为,(2)取算术平均值,然后(3)转换回原始的测量范围,可以获得这三种均值。x i y ix1,x2,,xnxiyi

算术平均值:显然,我们使用“ identity”转换:。因此,步骤(1)和(3)很简单(什么都不做),并且。ˉ X中号 = ˉ ÿyi=xix¯AM=y¯

几何平均值:这里的可加结构是原始观测值的对数。因此,我们取,然后在步骤(3)中获得GM,我们通过的反函数进行转换,即。登录ˉ X ģ 中号 = EXP ˉ Ýyi=logxilogx¯GM=exp(y¯)

谐波均值:这里的可加结构是我们观察值的倒数。因此,,。ˉ X ħ 中号 = 1 / ˉ ÿyi=1/xix¯HM=1/y¯

在物理问题中,这些问题通常是通过以下过程产生的:与确定的测量值和其他一些量(例如相关的保持固定。现在,我们玩以下游戏:保持和不变,并试图找到一些例如,如果我们更换每一个我们的个人意见由,那么“总”的关系仍然是保守的x 1x n z 1zwx1,,xn瓦特Ž 1 + + ž Ñ ˉ X X ˉ Xz1,,znwz1++znx¯xix¯

距离-速度-时间示例似乎很受欢迎,因此让我们使用它。

恒定距离,变化时间

考虑一个固定的行进距离。现在假设我们以速度行驶了次不同的时间,并花费了时间。我们现在玩我们的游戏。假设我们要用某个固定速度替换我们的各个速度,以使总时间保持恒定。注意,我们有 因此。当我们在游戏中用替换每个时,我们希望保留这种关系(总时间和总行驶距离)。因此, Ñ v 1... v Ñ 1... Ñ ˉ v d - v = 0dnv1,,vnt1,,tnv¯i

dviti=0,
v ° v Ñ d - ˉ v Σ = 0i(dviti)=0viv¯ = d / v ° v = Ñ
ndv¯iti=0,
并且由于每个,我们得到 ti=d/vi
v¯=n1v1++1vn=v¯HM.

请注意,此处的“加法结构”是针对各个时间的,而我们的测量结果与它们成反比,因此应用了谐波均值。

距离可变,时间恒定

现在,让我们改变情况。假设对于实例,我们以速度在距离经过固定时间。现在,我们希望保留总距离。我们有 并且如果则整个系统是守恒的。再次玩游戏,我们寻求一个使得 但是,由于,我们得到 ntv1,,vnd1,,dni

divit=0,
i(divit)=0v¯
i(div¯t)=0,
di=vit
v¯=1nivi=v¯AM.

在这里,我们试图保持的加性结构与我们的测量值成正比,因此采用算术平均值。

等体积的立方体

假设我们构造了一个具有给定体积的维盒子,而我们的测量值就是盒子的边长。然后 并假设我们要构造一个具有相同体积的维(超)立方体。也就是说,我们要用共同的边长替换我们的各个边长。然后 nVn x ˉ

V=x1x2xn,
nxix¯
V=x¯x¯x¯=x¯n.

这很容易表明我们应该使用。x¯=(xixn)1/n=x¯GM

请注意,加法结构为对数,即,我们尝试保留左手数量。logV=ilogxi

旧的新手段

作为练习,请考虑在第一个示例中让距离和时间都变化的情况下的“自然”含义。也就是说,我们具有距离,速度和时间。我们想要保留总的距离和行进时间,并找到一个常数来实现这一目标。v ° vdivitiv¯

练习:在这种情况下,“自然”是什么意思?


25
+1这是一个很好的答案。但是,我认为这在一个重要的方面是不完整的:在许多情况下,正确的使用方式是由我们试图回答的问题而不是数据中的任何数学结构决定的。在环境风险评估中就是一个很好的例子:监管机构希望随着时间的推移来估算人群的污染物暴露总量。这需要一个适当的加权算术平均,即使环境浓度数据通常具有乘法结构。几何平均值将是错误的估计值或估计值。
ub

7
@whuber:(+1)这是一个很好的评论。在构造答案的过程中,我采取了绝对非统计性的分叉方式,因此很高兴您提到这一点。这个主题值得一个完整的答案(提示)。
主教

9
@whuber:这也提出了一个事实(可能是无意的),即统计分析通常可能会受到领域专家(或可能是非专家)的监督,他们想估算对其领域有意义的东西,但几乎统计上完全不自然。我过去遇到的问题是,他们有时有时还希望指示进行统计估计的方式!:)
主教

1
@whuber:非常感谢您也可以将其观点添加到答案中,并进行一些详细说明。老实说,您的解释是我在Stats.SE上看到的最好的解释之一!
博士

3
来自@whuber的通常很棒的评论。有时(也许经常!)正确的使用方法是;相反,这个问题通常需要扩大到“我应该使用哪种集中趋势度量?”。
彼得·富勒姆

43

扩展@Brandon的出色评论(我认为应该提倡回答):

当您对乘法差异感兴趣时,应使用几何平均值。布兰登指出,范围不同时应使用几何平均值。这通常是正确的。原因是我们要均衡范围。例如,假设大学申请人的SAT分数(0到800),HS的平均成绩(0到4)和课外活动(1到10)得到了评分。如果一所大学希望对这些值求平均值并均衡范围(即每种质量相对于范围的权重增加),那么几何均值将是可行的方法。

但是,当我们使用不同范围的秤时,情况并非总是如此。如果我们比较不同国家(包括穷国和富国)的收入,我们可能不希望几何平均值,而想要算术平均值(或更可能是中位数或修整后的平均值)。

我看到的用于谐波均值的唯一用途是比较速率。例如:如果您以40英里/小时的速度从纽约开车到波士顿,然后以60英里/小时的速度返回,那么您的总体平均值不是 50英里/小时的算术平均值,而是谐波平均值。

(40+60)/2=502/(1/40+1/60)=48

240/5=48


3
为什么您的SAT / GPA /课外示例使用几何平均值而不是加权或比例算术平均值?为什么SAT或GPA为零意味着其他两个值变得无关紧要(正如几何平均值所暗示的那样)?如果课外活动倾向于聚集在比理论范围窄得多的范围内,那该怎么办?百分位数(或其他调整后的值)的算术平均值似乎比原始值的几何平均值更有意义。
ruakh

1
@ruakh有趣。在这种情况下,0问题并不重要,因为SAT和GPA不能真正为0(SAT = 0几乎是不可能的,而GPA为0则不会毕业)。我认为百分位数的算术平均值将接近其结论中的几何平均值(即使不是实际数字)。
彼得·富勒姆

31

我将尝试将其简化为3-4个经验法则,并提供更多有关勾股勾股方法的示例。

对于非负数据,这3个均值之间的关系为HM <GM <AM,但有一些变化。当且仅当样本数据完全没有差异时,它们才相等。

对于级别数据,请使用AM。价格就是一个很好的例子。对于比率,请使用GM。投资回报率,像彭博比利指数这样的相对价格(宜家的比利书架在不同国家的价格与美国价格相比)和联合国人类发展指数都是例子。HM适用于处理费率。这是David Giles提供的非汽车示例:

例如,考虑有关“每周工作小时数”(比率)的数据。假设我们有四个人(样本观察),每个人总共工作2000小时。但是,它们每周工作的小时数不同,如下所示:

Person      Total Hours       Hours per Week          Weeks Taken
1                  2,000                  40                   50
2                  2,000                  45                   44.4444
3                  2,000                  35                   57.142857
4                  2,000                  50                   40

Total:           8,000                                       191.587297

第三列中的值的算术平均值为AM =每周42.5小时。但是,请注意该值的含义。将样本成员的工作总周数(8,000)除以该平均值得出的值是188.2353,这是所有四个人工作的总周数。

现在查看上表中的最后一列。实际上,样本成员工作的总周数的正确值为191.5873周。如果我们在表的第三列中计算每周小时数的谐波均值,则HM = 41.75642小时(<AM),将该数字除以8,000小时,得出的正确结果为191.5873工作了几周。在这种情况下,谐波均值为样本平均值提供了适当的度量。

大卫还讨论了三种均值的加权形式,这些均值用于衡量通货膨胀的价格指数中。

除了劫机:

这些ROT并不完美。例如,我经常发现很难弄清是比率还是比率。投资收益通常在计算均值时被视为比率,但由于它们通常以“每单位时间的x%”表示,因此也是一种比率。“当数据是每单位时间的级别时使用HM”会更好吗?

如果您想总结北欧国家的巨无霸指数,您会使用通用汽车吗?


3
迟了几年,但是您是否找到了以下问题的答案:“如果您想总结北欧国家的巨无霸指数,您会使用通用汽车吗?” ?
StatsScared 2015年

2
@StatsScared Nope,但这将是一个很好的问题!
Dimitriy V. Masterov 2015年

7

您的问题的一个可能答案(“如何确定在给定上下文中最适合使用哪个均值?”)是意大利数学家Oscar Chisini给出的均值定义。

是一篇包含更详细说明和一些示例(平均行进速度等)的论文。


6
如果您可以在此处添加几行有关Chisini定义的信息,以防该链接失效,则可能是理想的选择,并且/或者帮助读者知道他们是否想单击该链接以进一步追求这些想法。
gung

2
确实,与本文的链接已失效。Wolfram链接没有提供任何关于Chisini定义如何用于确定在给定上下文中使用哪种含义的见解;在我看来,这只是数学上的概括,而不是使用的处方。
Ryan Simmons

1
通过使用DOI,可以看到该论文已移至tandfonline.com。引用:R Graziani,P Veronese(2009)。如何计算均值?Chisini方法及其应用。美国统计师63(1),第33-36页。tandfonline.com/doi/abs/10.1198/tast.2009.0006
akraf

0

我认为回答这个问题的简单方法是:

  1. 如果数学结构为xy = k(变量之间的逆关系),并且您正在寻找平均值,则需要使用谐波均值-等于加权算术平均值-考虑一下

谐波平均值= 2ab /(a + b)= a(b / a + b)+ b(a /(a + b)

例如:由于您投资的金额(A)保持固定,但每股价格(P)和股数(N)有所不同(A = PN),因此美元平均成本属于此类别。实际上,如果您将算术平均值视为一个均等地位于两个数字之间的数字,则谐波均值也是一个均等地位于两个数之间的数字,但是(这很好),“中心”是百分比(比率)为等于。即:(x-a)/ a =(b -x)/ b,其中x是谐波平均值。

  1. 如果数学结构是y = kx的直接变化,则可以使用算术平均值-在这种情况下,这是谐波平均值减小的结果。

1
$x$x\frac{a}{b}ab

假设您要合计几种不同模型的概率。在那种情况下,使用几何或调和均值是否有意义?
thecity2
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.