Answers:
如果您对均值感兴趣,请使用OLS;如果在中位数,请使用分位数。
一个很大的不同是,平均值受到异常值和其他极端数据的影响更大。有时,这就是您想要的。一个例子是,如果您的因变量是附近的社会资本。一个拥有大量社会资本的人的存在对于整个社区而言可能非常重要。
这个问题的前提似乎有些混乱。在第二段中,它说:“我们可以只使用中位数回归作为OLS的替代品”。请注意,对X的条件中位数进行回归是分位数回归。
如果基础数据生成过程中的错误是正态分布的(可以通过检查残差是否正常来评估),则条件均值等于条件中位数。此外,可以使用标准OLS方法针对X维中的给定点确定您可能感兴趣的任何分位数(例如,第95个百分点或第37个百分点)。分位数回归的主要吸引力在于它比OLS更强大。不利的一面是,如果所有假设都得到满足,效率将会降低(也就是说,您需要更大的样本量才能获得相同的功效/您的估算结果将不太准确)。
彼得·弗洛姆(Peter Flom)给出了一个简洁明了的答案,我只想扩展一下。问题中最重要的部分是如何定义“更差”。
为了定义更糟的情况,我们需要一些度量标准,并将计算配件的好坏的函数称为损失函数。
我们可以对损失函数有不同的定义,每个定义没有对与错,但是不同的定义可以满足不同的需求。两个众所周知的损失函数是平方损失和绝对值损失。
如果我们使用平方损失作为成功的衡量标准,则分位数回归将比OLS差。另一方面,如果使用绝对值损失,则分位数回归会更好。
彼得·福尔姆(Peter Folm)的回答是:
如果您对均值感兴趣,请使用OLS;如果在中位数,请使用分位数。