这个问题邀请我们在足够广泛的意义上表征“均值”的概念,以涵盖所有常用的均值-幂均值,均值,中位数,修整后的均值-但范围不广,以至于它几乎对数据毫无用处分析。此答复讨论了“均值”的任何合理有用的定义应具有的公理属性。Lp
基本公理
的“平均”用于数据分析的目的的有效广泛的定义将是明确定义的,确定性的功能的任何序列为和这样甲⊂ ř Ñ = 1 ,2 ,...fn:An→AA⊂Rn=1,2,…
(1)对于所有(均值位于极值之间),X = (X 1,X 2,... ,X Ñ)∈ 甲Ñmin(x)≤fn(x)≤max(x)x=(x1,x2,…,xn)∈An
(2)在其参数的置换下是不变的(意味着不关心数据的顺序),并且fn
(3)每个在其每个参数中均不变(随着数字增加,其均值不能减小)。fn
我们必须允许是实数(例如所有正数)的适当子集,因为仅在此类子集上定义了很多均值(例如几何均值)。A
我们可能还想补充一点
(1')中至少存在一些其中(意味着不是极端)。(我们不能要求始终保持该值。例如,的中位数等于,这是最小值。)分钟(X)≠ ˚F Ñ(X)≠ 最大值(X)(0 ,0 ,... ,0 ,1 )0x∈Amin(x)≠fn(x)≠max(x)(0,0,…,0,1)0
这些属性似乎捕捉了“均值”背后的思想,“均值”是一组(无序)数据的某种“中间值”。
一致性公理
我进一步倾向于规定不太明显的一致性标准
(4.a)随着在整个间隔变化,范围包括。换句话说,始终可以通过将适当的值到数据集来保持均值不变。与(3)结合使用,它意味着将极值与数据集相邻可以将均值拉向那些极值。t [ min (x),max (x)] f n(x)tfn+1(t,x1,x2,…,xn)t[ min (x),max (x)]Fñ(x)Ť
如果我们希望将均值的概念应用于分布或“无限总体”,那么一种方法是在任意大的随机样本的限制下获得均值。当然,该限制可能并不总是存在(例如,当分布没有期望时,算术平均值并不存在该限制)。因此,我不想施加任何其他公理来保证存在此类限制,但是以下内容似乎很自然且有用:
(4.b)每当有界且是来自支持的分布的样本序列时,几乎可以确定存在的极限。即使样本量越来越大,这也可以防止平均值永远在内“反弹” 。x n F A f n(x n)A一种XñF一种Fñ(xñ)一种
同样,我们可以进一步缩小均值的概念,坚持认为随着样本数量的增加,均值将成为更好的“位置”估计量:
(4.c)每当有界时,随机样本的采样分布的方差的非降在。f n(X (n ))X (n ) = (X 1,X 2,… ,X n)F n一种Fñ(X(n ))X(n )= (X1个,X2,… ,Xñ)Fñ
连续性公理
我们可能会考虑询问手段以使数据“略微”变化:
(5)在每个参数中分别是连续的(数据值的微小变化不应引起均值的突然跳跃)。Fñ
此要求可能消除了一些奇怪的概括,但不排除任何众所周知的均值。它将排除某些聚合功能。
不变公理
我们可以将均值视为适用于区间数据或比率数据(以史蒂文斯的众所周知的意义)。我们不能要求它们在位置变化时不变(几何平均值不是),但是我们可以要求
(6)对于所有和所有其中。这只是说我们可以自由地使用我们喜欢的任何度量单位来计算。X ∈ 甲Ñ λ > 0 λ X ∈ 甲Ñ ˚F ÑFñ(λ X)= λ ˚Fñ(x)X ∈一ñλ > 0λ X ∈ 甲ñFñ
问题中提到的所有方法都满足此公理,除了一些聚合函数。
讨论区
一般聚合函数,如在问题说明,否则不必然满足公理(1' ),(2),(3),(5)或(6)。它们是否满足任何一致性公理,可能取决于它们如何扩展到。 n > 2F2n > 2
通常的样本中值享有所有这些公理特性。
我们可以增加一致性公理以包括
(4.d) 对于所有X ∈ 甲Ñ。F2 n(x ; x)= fñ(x)X ∈一ñ。
这意味着,当数据集的所有元素均等地重复时,均值不会改变。但是,这可能太强了:Winsorized均值不具有此属性(渐近除外)。以水平进行Winsorize的目的是在任一极端情况下提供对至少数据变化的抵抗力。例如,10%平均极值调整的是的算术平均值,等于,但10%的极值调整平均的为。100 α %(1 ,2 ,3 ,6 )(2 ,2 ,3 ,3 )2.5 (1 ,1 ,2 ,2 ,3 ,3 ,6 ,6 )3.5100 α % 100 α %(1 ,2 ,3 ,6 )(2 ,2 ,3 ,3 )2.5(1 ,1 ,2 ,2 ,3 ,3 ,6 ,6 )3.5
我不知道哪种一致性公理(4.a),(4.b)或(4.c)是最理想或最有用的。它们似乎是独立的:我认为其中任何两个都不意味着第三个。