中位数是“均值”的某种概括的均值类型吗?


20

“均值”的概念远远超出了传统的算术平均值。它是否延伸到包括中位数?类推,

原始数据ID原始数据意思原始均值ID-1个算术平均值原始数据收据倒数意思平均倒数收据-1个谐波均值原始数据日志日志意思平均对数日志-1个几何平均数原始数据广场方格意思均方根广场-1个均方根原始数据等级意思平均等级-1个中位数

我得出的类比是拟算术平均值,由下式给出:

中号FX1个Xñ=F-1个1个ñ一世=1个ñFX一世

为了进行比较,当我们说一个五项数据集的中位数等于第三项时,我们可以看到,这相当于将数据从一到五进行排名(可以用函数表示)。取转换后数据的平均值(为三);并读回排名第三的数据项的值(一种)。FF-1个

在几何均值,谐波均值和RMS的示例中,是一个固定函数,可以单独应用于任何数字。相反,要分配等级,或从等级返回原始数据(必要时进行插值),则需要了解整个数据集。此外,在定义中,我已经阅读了准算术平均值,要求必须是连续的。中位数曾经被视为准算术平均值的特例吗?如果是,定义是什么?还是将中位数描述为“均值”的其他更广泛概念的实例?准算术平均值当然不是唯一可用的概括。FFF

问题的一部分是术语(“平均”到底意味着什么,特别是与“集中趋势”或“平均”相反)。例如,在模糊控制系统的文献中,聚集函数是一个递增函数,其中和 ; 对于[a,b]中所有x,y \ min的\ min(x,y)\ leq F(x,y)\ leq \ max(x,y)的聚合函数称为“均值”(在a一般意义)。毋庸置疑,这样的定义非常广泛!在这种情况下,中位数确实称为均值类型。^ {[1]}˚F = 一个˚F b b = b 分钟X ÿ ˚F X ÿ 最大X ÿ X ÿ [ F[一种b]×[一种b][一种b]F一种一种=一种Fbb=bXÿFXÿ最高Xÿ[ 1 ]Xÿ[一种b][1个]但是我很好奇,均值的较不广泛的特征是否仍然可以扩展到足以涵盖中位数的程度,即所谓的广义均值(最好将其描述为“幂均值”),而雷曼均值则不能,但其他可能。就其价值而言,Wikipedia在其“其他方式”列表中包括“中位数”,但无需进一步评论或引用。

[1个]:平均值的如此宽泛的定义,适用于两个以上的输入,似乎在模糊控制领域是标准的,并且在互联网搜索期间多次出现,以将中位数描述为中位数;我会引用例如Fodor,JC和Rudas,IJ(2009),“ 关于某些可迁移的聚合函数类 ”,IFSA / EUSFLAT Conf。(第653-656页)。顺便提一句,本文指出,“均值”(moyenne)一词的最早使用者是Cauchy,它来自1èrepartieCours d'analyse de l' E'cole royale polytechnique。分析algébrique(1821)。后来贡献AczélChisiniFodor,J.和Roubens,M.(1995),“ 论手段的意义 ”,《计算意义与应用数学》,第64页第 1期,和De Finetti在开发比Cauchy更普遍的“均值”概念时得到了认可。103-115。


我认为算术平均,中位数和众数矿石通常通常被称为“均值”,有时会用歧义的方式使用该词。《如何与统计数字撒谎》一书将其用作“与统计数字撒谎”的示例。(我了解您的问题较为笼统,因此请将其发布为评论。)
蒂姆

@Tim我有一种不科学的印象,很少看到“模式”被称为“平均值”。但是,在“平均”(有时被用作“算术平均值”的代名词,而有时包括根本不是指均值的集中趋势的量度)的使用方面,肯定存在着巨大的困惑。一般用途,而不是从技术意义上说,通常是(但不是专门用于)“算术平均值”)。顺便说一句,由于“平均值” 的其他含义,它也是互联网搜索的难点!
银鱼

3
平均值(算术,几何,谐波,幂,指数,组合等)是“解析平均值”。中位数,分位数,密语是“位置平均值”。排名与对数,平方等有很大不同,因为排名是从任何变量到统一变量的单调变换,并且没有退路。
ttnphns

顺便说一句,“广义均值”一词被en.wikipedia.org/wiki/Generalized_mean
ttnphns

3
如果您在计算允许权重,那么中值很容易被视为一种平均值。同样,但不完全相同,修剪均值的概念当然包括中位数,作为限制或礼节性的特殊情况。stata-journal.com/article.html?article=st0313是一项相当近期的评论。iwixi,iwi=1
尼克·考克斯

Answers:


9

这是将中位数视为“一般均值” 的一种方法-首先,根据阶次统计信息仔细定义普通的算术均值:

X¯=一世w一世X一世w一世=1个ñ

然后,通过用其他权重函数替换该订单统计信息的普通平均值,我们得到一个解释订单的“广义均值”概念。

在那种情况下,许多潜在的中心测度变成“广义的手段”。在中位数的情况下,对于奇数,并且所有其他均为0,对于偶数,。w n + 1 / 2 = 1 n w nñwñ+1个/2=1个ñwñ2=wñ2+1个=1个2

同样,如果我们看一下M-estimation,则位置估计也可以被认为是算术平均值的一般化(对于平均值,是平方的,是线性的,或者权重函数是平坦的),并且中位数也属于此类归纳。这与之前的概括有些不同。ψρψ

我们可以通过多种其他方式扩展“均值”的概念,其中包括中位数。


很好 与该答案密切相关,并且在问题中引用的论文中对此进行了讨论:有序加权平均值或OWA
Silverfish

11

如果将平均值视为使二次损失函数SSE最小的点,则中位数是使线性损失函数MAD最小的点,而众数是使0-1损失函数最小的点。无需任何转换。

因此,中位数是弗雷歇特均值的一个示例。


3
@迈克·安德森(Mike Anderson):好的,这表明媒体是弗雷谢特的意思(请参阅维基百科文章):en.wikipedia.org/wiki/Fr%C3%A9chet_mean
kjetil b halvorsen

@Kjetil太好了!中位数是弗雷切特均值的一个例子,这恰好回答了我的问题“中位数是否曾被描述为“均值”的其他更广泛概念的实例?” 并为Mike Anderson +1。我希望将这些信息编辑成答案。
Silverfish

2
我在答案中添加了@Kjetil的评论,以便其在网站搜索“ Frechet Mean”中显示。感谢你们俩。
银鱼

4

一个简单的但卓有成效一般化是加权装置,其中。显然,公共或花园均值是权重相等的最简单的特例。n i = 1 w i = 1 w i = 1 / n一世=1个ñw一世X一世/一世=1个ñw一世一世=1个ñw一世=1个w一世=1个/ñ

权重取决于大小值的大小顺序(从最小到最大),这指向其他各种特殊情况,尤其是“ 均值修整”的概念,其他名称也是如此。

为了避免在不需要或特别有用的地方过度使用符号,请想象一下,例如忽略最小和最大值,并取其他值的(均等加权)平均值。或者想象一下忽略最小的两个和最大的两个,取其他的平均值。等等。最有力的修整将按顺序忽略一个或两个中间值,这取决于值的数量是奇数还是偶数,这自然只是熟悉的中位数。修剪的主意并不能使您忽略样本每条尾巴中的相等数字,但是说不对称修剪的更多内容将使我们远离该主题的主要思想。

简而言之,均值(不合格)和中位数是(对称)修整均值系列的极端限制情况。总体思路是在使用数据中所有信息的一种理想与保护自己免受极端数据点(可能是不可靠的异常值)的另一种理想之间做出折衷。

有关最新的评论,请参见此处的参考


4

这个问题邀请我们在足够广泛的意义上表征“均值”的概念,以涵盖所有常用的均值-幂均值,均值,中位数,修整后的均值-但范围不广,以至于它几乎对数据毫无用处分析。此答复讨论了“均值”的任何合理有用的定义应具有的公理属性。Lp


基本公理

的“平均”用于数据分析的目的的有效广泛的定义将是明确定义的,确定性的功能的任何序列为和这样ř Ñ = 1 2 ...fn:AnAA[Rñ=1个2

(1)对于所有(均值位于极值之间),X = X 1X 2... X ÑÑXFñX最高XX=X1个X2Xñ一种ñ

(2)在其参数的置换下是不变的(意味着不关心数据的顺序),并且Fñ

(3)每个在其每个参数中均不变(随着数字增加,其均值不能减小)。Fñ

我们必须允许是实数(例如所有正数)的适当子集,因为仅在此类子集上定义了很多均值(例如几何均值)。一种

我们可能还想补充一点

(1')中至少存在一些其中(意味着不是极端)。(我们不能要求始终保持该值。例如,的中位数等于,这是最小值。)分钟X˚F ÑX最大值X0 0 ... 0 1 0X一种XFñX最高X0001个0

这些属性似乎捕捉了“均值”背后的思想,“均值”是一组(无序)数据的某种“中间值”。

一致性公理

我进一步倾向于规定不太明显的一致性标准

(4.a)随着在整个间隔变化,范围包括。换句话说,始终可以通过将适当的值到数据集来保持均值不变。与(3)结合使用,它意味着将极值与数据集相邻可以将均值拉向那些极值。t [ min xmax x] f nxtFñ+1个ŤX1个X2Xñt[(X最高X]FñXŤ

如果我们希望将均值的概念应用于分布或“无限总体”,那么一种方法是在任意大的随机样本的限制下获得均值。当然,该限制可能并不总是存在(例如,当分布没有期望时,算术平均值并不存在该限制)。因此,我不想施加任何其他公理来保证存在此类限制,但是以下内容似乎很自然且有用:

(4.b)每当有界且是来自支持的分布的样本序列时,几乎可以确定存在的极限。即使样本量越来越大,这也可以防止平均值永远在内“反弹” 。x n F A f nx nA一种XñF一种FñXñ一种

同样,我们可以进一步缩小均值的概念,坚持认为随着样本数量的增加,均值将成为更好的“位置”估计量:

(4.c)每当有界时,随机样本的采样分布的方差的非降在。f nX n X n = X 1X 2X nF n一种FñXñXñ=X1个X2XñFñ

连续性公理

我们可能会考虑询问手段以使数据“略微”变化:

(5)在每个参数中分别是连续的(数据值的微小变化不应引起均值的突然跳跃)。Fñ

此要求可能消除了一些奇怪的概括,但不排除任何众所周知的均值。它将排除某些聚合功能。

不变公理

我们可以将均值视为适用于区间数据或比率数据(以史蒂文斯的众所周知的意义)。我们不能要求它们在位置变化时不变(几何平均值不是),但是我们可以要求

(6)对于所有和所有其中。这只是说我们可以自由地使用我们喜欢的任何度量单位来计算。XÑ λ > 0 λ XÑ ˚F ÑFñλX=λFñXX一种ñλ>0λX一种ñFñ

问题中提到的所有方法都满足此公理,除了一些聚合函数。


讨论区

一般聚合函数,如在问题说明,否则必然满足公理(1' ),(2),(3),(5)或(6)。它们是否满足任何一致性公理,可能取决于它们如何扩展到。 n > 2F2ñ>2

通常的样本中值享有所有这些公理特性。

我们可以增加一致性公理以包括

(4.d) 对于所有XÑF2ñX;X=FñXX一种ñ

这意味着,当数据集的所有元素均等地重复时,均值不会改变。但是,这可能太强了:Winsorized均值不具有此属性(渐近除外)。以水平进行Winsorize的目的是在任一极端情况下提供对至少数据变化的抵抗力例如,10%平均极值调整的是的算术平均值,等于,但10%的极值调整平均的为。100 α 1 2 3 6 2 2 3 3 2.5 1 1 2 2 3 3 6 6 3.5100α 100α1个23622332.51个1个2233663.5

我不知道哪种一致性公理(4.a),(4.b)或(4.c)是最理想或最有用的。它们似乎是独立的:我认为其中任何两个都不意味着第三个。


(+1)我认为(1')“手段不是极端”是一个有趣的观点。平均值的许多其他自然定义碰巧包括最小或最大值,作为特殊情况或限制情况:幂平均值雷默平均值弗雷谢平均值基西尼平均值斯托拉尔斯基平均值都适用。将它们称为“平均”似乎有些奇怪!
Silverfish

是的,限制案件是不可避免的。但是对于有限的数据集,我们可能要坚持认为最大值和最小值均不等于“均值”。
ub

另一方面,“通常的样本中位数具有所有这些公理特性”不仅如此,而且通常的样本分位数也是如此(除非我错过了一些东西)。将例如上四分位数称为“均值”也感觉有些奇怪(尽管我已经将其用作对非常偏斜的数据的集中趋势的度量)。如果我们接受所有其他分位数,那么接受最小值和最大值就不再那么反常了。但我当然可以看到,至少保留排除这些权利的做法可能是可取的。
银鱼

1
我对分位数加入万能的万神殿并不感到困扰。毕竟,对于给定的分布族,某些非中位数分位数将与算术平均值一致,因此,如果您试图公理地消除这种可能性,则可能会遇到麻烦。(例如,考虑恒定几何SD的对数正态分布族。)如果算术平均值不能符合均值的要求,则所有均将丢失!
ub

1
我已经考虑了该方法并拒绝了它,如我的回答中所述:如果对应用这样的标准,则将中位数作为均值形式消除!ñ>2
ub

2

我认为中位数可以视为算术平均值的一种概括。具体来说,算术平均值和中位数(以及其他)可以统一为Chisini平均值的特殊情况。如果要对一组值执行某些运算,则Chisini均值是一个数字,您可以用它代替组中的所有原始值,但仍得到相同的结果。例如,如果要对值求和,则用算术平均值替换所有值将产生相同的总和。这种想法是,在对某个数字进行某种操作的上下文中,某个值代表该数字。(这种思维方式的一个有趣的含义是,给定的值(算术平均值)只能在假设您正在使用这些数字进行某些操作的前提下才能视为具有代表性。)

对于中位数而言,这种情况不太明显(我注意到中位数并未在Wolfram或Wikipedia上被列为基希尼语中的一种意思),但是如果您允许进行排名以上的操作,则中位数可能符合相同的想法。


中号F中号中号中号=FX1个X2Xñ

这是个好问题,@ Silverfish,我一直在考虑;-)。我的想法是,在您的Q和评论讨论中,概念框架似乎是如何获取均值以及如何从均值中获取数据。OTOH,我的构架是我们使用的意思是:即作为具有最小信息损失的数据的压缩表示。
gung-恢复莫妮卡

F

@Silverfish,我认为我的职位确实存在问题。
gung-恢复莫妮卡

X¯X¯X¯X¯

-1

这个问题没有很好地定义。如果我们同意均值的常见“街道”定义,即n个数字的总和除以n,那么我们的利益就很大。此外,如果我们看一下集中趋势的度量,我们可以说均值和中位数都是基因实现的,而不是彼此实现的。我的部分背景是非参数的,所以我喜欢中位数及其提供的鲁棒性,单调变换的不变性等等。但是每项措施都有其根据目标而定的位置。


2
欢迎来到我们的网站,鲍勃。我相信,如果您读到问题的末尾,尤其是倒数第二长的段落,您会发现它是精确且定义明确的。(如果不是这样,这将是一个好主意,解释一下的“没有明确定义的意思。)您的意见并不真的似乎地址问什么。
whuber

1
实际上,我很同情鲍勃的感觉,即“均值”的概念没有一个单一的定义,在某种意义上说,这个问题的定义不是很明确,但我已尽力使事情尽可能清晰。我希望我最近的编辑可以帮助您弄清楚。
银鱼

1
我觉得这个问题除了单纯的术语之外还有其他价值的原因(无论如何,这意味着什么,是否可以扩展到包括中位数的定义?)是将中位数视为一个可能会有所启发均值泛化族的成员;尼克·考克斯(Nick Cox)用中位数作为修整均值的极限情况的示例特别好-与您喜欢的“鲁棒性”属性密切相关。在修剪均值的族中,“街道”算术平均值和中位数位于相对的两端,并在它们之间具有频谱。
银鱼
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.