Answers:
我理解这个问题是为了寻求对如何将产生给定分位数的任何损失函数作为损失最小化器进行深入了解的能力,而不管潜在的分布是什么。 因此,仅仅在Wikipedia或其他地方重复分析就可以证明这种特殊的损失函数是有效的。
让我们从熟悉和简单的事情开始。
您正在谈论的是找到相对于数据的分布或集合的“位置”。例如,众所周知,平均值使期望的平方余数最小化;也就是说,这是一个 ˚F ˉ X
尽可能小。我用这个符号来提醒我们是从损失中得出的,它由确定,但最重要的是,它取决于数字。ˉ X
显示最小化任何函数的标准方法始于表明,当稍作更改时,函数的值不会减小。这样的值称为函数的临界点。 x ∗
哪种损失函数将导致百分位数是临界点?该价值的损失将是˚F - 1(α )
为了使其成为临界点,其导数必须为零。因为我们只是试图找到一些解决方案,我们不会停下来看看操作是否是合法的:我们将计划检查技术细节(比如是否我们真的能够区分,等等)结尾。从而
在左侧,的参数为负,而在右侧为正。除此之外,我们对这些积分的值几乎没有控制权,因为可以是任何分布函数。 因此,我们唯一的希望是使仅取决于其参数的符号,否则它必须是恒定的。˚F Λ “
这意味着将是分段线性的,潜在具有零权不同斜率的左侧和。显然,随着接近零,它应该减少-毕竟是损失而不是收益。而且,将缩放为常数不会改变其属性,因此我们可以随意将左斜率设置为。令为右斜率。然后简化为Λ - 1个τ > 0 (1 )
那里的独特的解决方案是,由正倍数,
将此(自然)解乘以即可清除分母,从而产生问题中提出的损失函数。
当具有这种形式时,显然我们所有的操作在数学上都是合法的。