我正在阅读有关分位数功能的信息,但我不清楚。您能否提供比以下提供的更为直观的解释?
由于cdf 是单调递增的函数,因此它具有反函数。让我们用F - 1来表示。如果˚F是的CDF X,然后˚F - 1(α )是的值X α,使得P (X ≤ X α)= α ; 这称为F的α分位数。值F − 1(0.5 )是分布的中位数,概率质量的一半在左侧,一半在右侧。值 和˚F - 1(0.75 )是下和上四分位。
我正在阅读有关分位数功能的信息,但我不清楚。您能否提供比以下提供的更为直观的解释?
由于cdf 是单调递增的函数,因此它具有反函数。让我们用F - 1来表示。如果˚F是的CDF X,然后˚F - 1(α )是的值X α,使得P (X ≤ X α)= α ; 这称为F的α分位数。值F − 1(0.5 )是分布的中位数,概率质量的一半在左侧,一半在右侧。值 和˚F - 1(0.75 )是下和上四分位。
Answers:
所有这些乍一看可能很复杂,但本质上是非常简单的事情。
通过累积分布函数,我们表示返回概率小于或等于某个值,
此函数将用作输入,并返回间隔(概率)中的值-将它们表示为。累积分布函数(或分位数函数)的逆函数告诉您使返回某个值,
在下图中以正态累积分布函数(及其反函数)为例进行了说明。
作为一个简单的示例,您可以采用标准的Gumbel分布。其累积分布函数为
它可以很容易地反转:回想自然对数函数是指数函数的逆,因此,很明显,用于Gumbel分布的分位数函数是
如您所见,分位数函数根据其替代名称“反转”了累积分布函数的行为。
并非每个函数都有逆函数。这就是为什么您引用的语录说“单调递增函数”。回想一下,从函数的定义来看,它必须为每个输入值精确分配一个输出。连续随机变量的累积分布函数满足此属性,因为它们是单调递增的。对于离散随机变量,累积分布函数不连续且不连续,因此我们使用需要不减小的广义逆分布函数。更正式地说,广义逆分布函数定义为
该定义翻译成普通的英语,它表示对于给定的概率值,我们正在寻找,导致返回的值大于或等于,但由于可能存在多个满足此要求的值条件(例如对任何都是true ),因此我们取其中最小的。
通常,对于可以为不同输入返回相同值的函数,例如密度函数(例如,标准法线密度函数是对称的,因此它对和等返回相同的值)没有反函数。由于另一个原因,正态分布是一个有趣的示例-它是不具有闭合形式逆的累积分布函数的示例之一。并非每个累积分布函数都必须具有闭合形式的逆函数!希望在这种情况下可以使用数值方法求逆。
分位数函数可用于随机生成,如反变换方法如何工作中所述?