为什么基本的假设检验关注均值而不关注中位数?


32

在基本的本科统计课程中,通常会教学生(假设?)针对总体平均值的假设检验。
为什么重点放在均值而不是中位数?我的猜测是,由于中心极限定理,测试均值更容易,但是我很想阅读一些有根据的解释。


3
平均值具有用于唯一性,计算和演算的有用属性。它通常与足够的统计信息有关。
亨利

Answers:


40

因为艾伦·图灵(Alan Turing)是罗纳德·费舍(Ronald Fisher)出生的。

在过去,在使用计算机之前,所有这些工作都必须由手工完成,或者最多只能由我们现在称为计算器的工作来完成。可以通过这种方式进行比较均值的测试-这很费力,但可能。用这种方法测试分位数(例如中位数)几乎是不可能的。

例如,分位数回归依赖于使相对复杂的函数最小化,这是无法手动完成的。编程是可能的。参见例如KoenkerWikipedia

分位数回归的假设少于OLS回归,并提供了更多信息。


6
当时确实存在计算机,但其含义与我们现在所说的完全不同。
Maarten Buis

6
确实!计算机是进行计算的人。
彼得·弗洛姆

2
@nafrtiti教学大纲在变化,但变化缓慢。有很多需要克服的势头,统计之外的人还不习惯新想法,因此可能会拒绝它们。
彼得·弗洛姆

3
@SunQingyao排序比添加要昂贵得多。加是O(n),它是硬件最基本的操作之一,只需要一个寄存器。除此之外,我需要知道的是总数和更多数据项的数量并计算新的均值。为了计算中位数,我需要全套
JimmyJames

3
使用快速选择(如果随机选择了错误的枢轴,则使用5中位数来选择枢轴),您可以找到O(N)的分位数,从而使中位数和平均值之间的差距变小。当然,您需要知道这样的方法存在(即使在图灵斯时期也是未知的)。
Surt

22

我想在Harrell和Flom给出的正确原因中添加第三个原因。原因是我们使用欧几里得距离(或L2)而不是曼哈顿距离(或L1)作为我们的接近度或误差标准度量。如果一个人有多个数据点而一个人想要一个数字θ 来估计它,一个显而易见的想法是找到一个最小化“误差”的数字,即该数字在所选数字和构成数据的数字。在数学符号,对于给定的误差函数E,一个想要找到Ñ θ ∈ [R é θ x1,xnθ。如果一个花费E(X,Y)的L2范数或距离,即 ë X Ý = X - Ý 2,则最小化在所有 θ ∈ [R是平均。如果采用L1或Manhattan距离,则整个minθR(E(θ,x1,xn)=minθR(i=1i=nE(θ,xi))E(x,y)=(xy)2θR是中值。因此,平均值是自然的数学选择-如果使用L2距离!θ[R


6
由于被广泛用来表示期望,我建议更换ê着,说,犯错误EEErr
理查德·哈迪

3
也许值得注意的是,x = 0时是可微的,而| x | 不是。我认为,这是微妙但关键的根本原因,为什么MSE在数学统计领域比MAE更普遍。x2x=0|x|
Just_to_Answer

1
@Just_to_Answer-我认为这是另一个原因。这些年来,我已经考虑了很多。对我来说,我的结论是,您的发言与我们通常使用欧几里得而不是曼哈顿距离的原因有关:)
aginensky

19

通常,选择均值不是因为中位数更具代表性,更可靠或更有意义,而是因为人们将估计量与估计量混淆了。换句话说,有些人选择总体均值作为关注数量,因为在正态分布下,样本均值比样本中位数更精确。相反,正如您所做的那样,他们应该更多地考虑真正的利息量。

一个侧边栏:对于总体中位数,我们有一个非参数置信区间,但是没有非参数方法(也许是数值密集的经验似然法除外)来获得总体平均值的置信区间。如果您希望保持自由分布,则可以集中在中位数上。

请注意,中心极限定理远没有看起来有用,正如该站点上其他地方所讨论的。它有效地假设方差是已知的,或者分布是对称的,并且其形状使得样本方差是色散的竞争估计。


2
我相信可以为平均值构造一个非参数置信区间-例如通过置换检验(例如,可以在对称假设下完成,而无需假设任何特定的函数形式)。尽管在对称性以外的其他一些假设下也有可能,但这种情况在某种程度上受到了限制。如果您准备好应对自举所带来的大致覆盖范围,则可以在没有诸如对称性这样的假设的情况下获得非参数间隔。
Glen_b-恢复莫妮卡(Monica)

2
如果假设对称,则它是参数化的。还没有看到这种情况扩展到非对称情况。引导程序(除了可能的学生化t方法外,所有其他变体)在严重不对称情况下都非常不准确。参见stats.stackexchange.com/questions/186957
弗兰克·哈雷尔

5
对称性不是有限参数。Wilcoxon有符号秩检验假设在零值以下对称(以使符号具有可交换性)。您会称其为参量吗?
Glen_b-恢复莫妮卡


2
关于对称性的@Glen_b问题-这是一个很好的问题。Wilcoxon带符号秩检验是一个有趣的案例,因为与WIlcoxon 2样本检验不同,它提出了一个严格的对称假设。我猜您可以说您可以是非参数的,同时仍然需要某种通用假设,例如对称性。也许术语应该是“非参数性的”?另一方面,非参数2样本检验在优化II型错误(但不是I型错误)方面有限制。
弗兰克·哈雷尔
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.