几何平均值和算术平均值相差很远,例如〜0.1%,有什么重要意义吗?对于这样的数据集可以做出什么推测?
我一直在分析数据集,但我发现具有讽刺意味的是,这些值非常非常接近。不精确,但接近。此外,对算术平均数几何平均数不等式的快速理智检查以及对数据采集的回顾显示,就我如何得出这些值而言,我的数据集的完整性没有任何困扰。
几何平均值和算术平均值相差很远,例如〜0.1%,有什么重要意义吗?对于这样的数据集可以做出什么推测?
我一直在分析数据集,但我发现具有讽刺意味的是,这些值非常非常接近。不精确,但接近。此外,对算术平均数几何平均数不等式的快速理智检查以及对数据采集的回顾显示,就我如何得出这些值而言,我的数据集的完整性没有任何困扰。
Answers:
算术平均值通过算术平均值-几何平均值(AMGM)不等式与几何平均值相关,该不等式表明:
如果达到平等。因此,您的数据点可能彼此非常接近。
详细阐述@Alex R的答案,一种看待AMGM不平等的方法就是詹森的不平等效应。根据詹森的不等式: 然后取双方的指数: 1
右侧是几何平均值,因为
AMGM不平等什么时候能保持近似相等?当詹森的不平等效应很小时。导致詹森不等式效应的是凹度,即对数的曲率。如果您的数据分布在对数具有曲率的区域,则效果会很大。如果您的数据分布在对数基本上是仿射的区域,那么影响将很小。
例如,如果数据变化很小,并在足够小的邻域内聚集在一起,那么对数将看起来像该区域的仿射函数(微积分的主题是,如果您对平滑,连续的函数进行足够的放大,它看起来像一条线)。对于足够接近的数据,数据的算术平均值将接近几何平均值。
x=c(-5,-5,1,2,3,10); prod(x)^(1/length(x))
[1] 3.383363