Answers:
因为艾伦·图灵(Alan Turing)是罗纳德·费舍(Ronald Fisher)出生的。
在过去,在使用计算机之前,所有这些工作都必须由手工完成,或者最多只能由我们现在称为计算器的工作来完成。可以通过这种方式进行比较均值的测试-这很费力,但可能。用这种方法测试分位数(例如中位数)几乎是不可能的。
例如,分位数回归依赖于使相对复杂的函数最小化,这是无法手动完成的。编程是可能的。参见例如Koenker或Wikipedia。
分位数回归的假设少于OLS回归,并提供了更多信息。
我想在Harrell和Flom给出的正确原因中添加第三个原因。原因是我们使用欧几里得距离(或L2)而不是曼哈顿距离(或L1)作为我们的接近度或误差标准度量。如果一个人有多个数据点而一个人想要一个数字θ 来估计它,一个显而易见的想法是找到一个最小化“误差”的数字,即该数字在所选数字和构成数据的数字。在数学符号,对于给定的误差函数E,一个想要找到米我Ñ θ ∈ [R (é (θ ,。如果一个花费E(X,Y)的L2范数或距离,即 ë (X ,Ý )= (X - Ý )2,则最小化在所有 θ ∈ [R是平均。如果采用L1或Manhattan距离,则整个是中值。因此,平均值是自然的数学选择-如果使用L2距离!
通常,选择均值不是因为中位数更具代表性,更可靠或更有意义,而是因为人们将估计量与估计量混淆了。换句话说,有些人选择总体均值作为关注数量,因为在正态分布下,样本均值比样本中位数更精确。相反,正如您所做的那样,他们应该更多地考虑真正的利息量。
一个侧边栏:对于总体中位数,我们有一个非参数置信区间,但是没有非参数方法(也许是数值密集的经验似然法除外)来获得总体平均值的置信区间。如果您希望保持自由分布,则可以集中在中位数上。
请注意,中心极限定理远没有看起来有用,正如该站点上其他地方所讨论的。它有效地假设方差是已知的,或者分布是对称的,并且其形状使得样本方差是色散的竞争估计。