当算术平均值非常接近几何平均值时,可以对数据得出什么结论?


24

几何平均值和算术平均值相差很远,例如〜0.1%,有什么重要意义吗?对于这样的数据集可以做出什么推测?

我一直在分析数据集,但我发现具有讽刺意味的是,这些值非常非常接近。不精确,但接近。此外,对算术平均数几何平均数不等式的快速理智检查以及对数据采集的回顾显示,就我如何得出这些值而言,我的数据集的完整性没有任何困扰。


6
小提示:首先检查您的数据是否全部正确;偶数个负值可能会使您得到正数产品,并且某些包装可能不会标记出潜在的问题(AM-GM不等式取决于所有正值)。参见示例(在R中): (而算术平均值为1)x=c(-5,-5,1,2,3,10); prod(x)^(1/length(x)) [1] 3.383363
Glen_b-恢复莫妮卡

1
为了详细说明@Glen_b的观点,数据集总是具有相等的算术和几何平均值,即零。但是,我们可以根据需要分散三个值。{-X0X}
hardmath

算术和几何均值具有相同的广义公式,其中给出前者,p \ rightarrow 0给出后者。然后从直觉上变得清楚,当数据值x越来越相等时,两者变得越来越接近,接近恒定。p 0 xp=1个p0X
ttnphns

Answers:


29

算术平均值通过算术平均值-几何平均值(AMGM)不等式与几何平均值相关,该不等式表明:

X1个+X2++XññX1个X2Xññ

如果达到平等。因此,您的数据点可能彼此非常接近。X1个=X2==Xñ


4
这是正确的。通常,值的方差越小,两个均值越接近。
Michael M

16
通过比较观察值的大小,方差必须很小。因此,变化系数必须很小。σ/μ
Michael Hardy

1
AMGM代表什么吗?如果是这样,最好将其阐明。
理查德·哈迪

@RichardHardy:AMGM代表“算术平均数-几何平均数”

1
@ user1108,谢谢,实际上,我在阅读其他帖子后就了解了。我只是认为可以在答案中阐明(不仅在评论中)。
理查德·哈迪

15

详细阐述@Alex R的答案,一种看待AMGM不平等的方法就是詹森的不平等效应。根据詹森的不等式: 然后取双方的指数: 1

日志1个ñ一世X一世1个ñ一世日志X一世
1个ñ一世X一世经验值1个ñ一世日志X一世

右侧是几何平均值,因为X1个X2Xñ1个/ñ=经验值1个ñ一世日志X一世

AMGM不平等什么时候能保持近似相等?当詹森的不平等效应很小时。导致詹森不等式效应的是凹度,即对数的曲率。如果您的数据分布在对数具有曲率的区域,则效果会很大。如果您的数据分布在对数基本上是仿射的区域,那么影响将很小。

例如,如果数据变化很小,并在足够小的邻域内聚集在一起,那么对数将看起来像该区域的仿射函数(微积分的主题是,如果您对平滑,连续的函数进行足够的放大,它看起来像一条线)。对于足够接近的数据,数据的算术平均值将接近几何平均值。


12

让我们调查的范围因为它们的算术平均值(AM)是一个小的多1 + δ其几何平均(GM)(具有δ 0)。在的问题,δ 0.001,但我们不知道ñX1个X2Xñ1个+δδ0δ0.001ñ

由于更改测量单位时这些均值的比率不会改变,因此请选择GM为。因此,我们寻求最大化X Ñ受该约束X 1 + X 2 + + X Ñ = Ñ 1 + δ X 1X 2X Ñ = 11个XñX1个+X2++Xñ=ñ1个+δX1个X2Xñ=1个

这将通过使进行,比方说,和X Ñ = Ž X。从而X1个=X2==Xñ-1个=XXñ=žX

ñ1个+δ=X1个++Xñ=ñ-1个X+ž

1个=X1个X2Xñ=Xñ-1个ž

将溶液是间的根01X01个

(1ñXñ+ñ1个+δXñ-1个-1。

它很容易迭代找到。下面是最佳的曲线图ž作为的函数δÑ = 6 20 50 150,从左到右依次为:Xžδñ=62050150

数字

ñ1.001XñX一世

ñ=2ķX一世X1个ž1个

Xķ=1个+δ±δ2+2δ

δδ2ķ

X1个+δ-2δķ; ž1个+δ+2δķ

32δ/ñ

ñδ

X一世


ñ=150δ=0.002X0.9954ž1.983ķ=75X0.99918ž1.00087

ñ=150X149ž=1个149X+ž=1501.002=150.3X=0.995416ž=1.98308

ž1个+δ+2δķ=1个+0.002+2×0.002751.00087X

Xž75X+75ž150.3X75ž751个
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.