帮助我了解分位数(CDF逆函数)


25

我正在阅读有关分位数功能的信息,但我不清楚。您能否提供比以下提供的更为直观的​​解释?

由于cdf 是单调递增的函数,因此它具有反函数。让我们用F - 1来表示。如果˚F是的CDF X,然后˚F - 1α 是的值X α,使得P X X α= α ; 这称为Fα分位数。值F 10.5 FF1FXF1(α)xαP(Xxα)=ααFF1(0.5)是分布的中位数,概率质量的一半在左侧,一半在右侧。值 ˚F - 10.75 是下和上四分位。F1(0.25)F1(0.75)


您应该学习使用数学标记,请参阅我的编辑!
kjetil b halvorsen '16

6
这是在一定程度上进行简要解释的模型,并且已经包含示例。目前尚不清楚您要寻求哪种解释水平。答案可能比此答案长10倍,具体取决于您不知道的内容。例如,您知道CDF吗?您知道“单调增加”是什么意思吗?你知道逆函数是什么吗?我们只是第一句话的一部分。您的问题等同于您不了解(全部)的陈述,尽管我们没有理由怀疑您,但这根本不是一个精确的问题。
尼克·考克斯

Answers:


38

所有这些乍一看可能很复杂,但本质上是非常简单的事情。

通过累积分布函数,我们表示返回X概率小于或等于某个值x

Pr(Xx)=F(x).

此函数将用作输入,并返回间隔(概率)中的值-将它们表示为。累积分布函数(或分位数函数)的函数告诉您使返回某个值,x[0,1]pxF(x)p

F1(p)=x.

在下图中以正态累积分布函数(及其反函数)为例进行了说明。

在此处输入图片说明

作为一个简单的示例,您可以采用标准的Gumbel分布。其累积分布函数为

F(x)=eex

它可以很容易地反转:回想自然对数函数是指数函数的逆,因此,很明显,用于Gumbel分布的分位数函数是

F1(p)=ln(ln(p))

如您所见,分位数函数根据其替代名称“反转”了累积分布函数的行为。

广义逆分布函数

并非每个函数都有逆函数。这就是为什么您引用的语录说“单调递增函数”。回想一下,从函数的定义来看,它必须为每个输入值精确分配一个输出。连续随机变量的累积分布函数满足此属性,因为它们是单调递增的。对于离散随机变量,累积分布函数不连续且不连续,因此我们使用需要不减小的广义逆分布函数。更正式地说,广义逆分布函数定义为

F1(p)=inf{xR:F(x)p}.

该定义翻译成普通的英语,它表示对于给定的概率值,我们正在寻找,导致返回的值大于或等于,但由于可能存在多个满足此要求的值条件(例如对任何都是true ),因此我们取其中最小的。pxF(x)pxF(x)0 xx

无反函数

通常,对于可以为不同输入返回相同值的函数,例如密度函数(例如,标准法线密度函数是对称的,因此它对和等返回相同的值)没有反函数。由于另一个原因,正态分布是一个有趣的示例-它是不具有闭合形式逆的累积分布函数的示例之一。并非每个累积分布函数都必须具有闭合形式的逆函数!希望在这种情况下可以使用数值方法求逆。22

用例

分位数函数可用于随机生成,如反变换方法如何工作中所述?


2
直到倒数第二段为止,这个答案一直有效。到您到达那里时,您已经断言每个连续CDF都有一个逆,但是随后您似乎提供了正态分布作为该正则表达式的反例。这可能非常令人困惑。
ub

2
@whuber,您是对的,添加了一个句子使其更清楚。

2
蒂姆,我又添加了一个词来使它更加清晰:)
变形虫说恢复莫妮卡

@Tim很好的答案,但是您能否阐明反CDF吗?正如您提到的,我们问将使。我理解部分如下。由于cdf是单调递增的,因此有许多值都满足但是将给出最大下限,即,固定唯一点,并以此定义广义逆。这有意义吗?F1(u)=inf{x:F(x)u}xF(x)=pinfF(x)uinf
亚历山大·斯卡

@AlexanderCska是的,基本上,多个F(x)值大于u,因此我们取下限,“满足此条件的最小值”。
蒂姆

1

蒂姆有一个非常彻底的答案。做得好!

我想再说一遍。并非每个单调递增的函数都具有反函数。实际上,只有严格单调递增/递减的函数才具有反函数。

对于不是严格单调增加的单调增加的cdf,我们有一个分位数函数,也称为反累积分布函数。您可以在此处找到更多详细信息。

逆函数(对于那些严格增加cdf的函数)和分位数函数(对于那些单调增加但不是严格单调增加的cdfs)都可以表示为,这有时会造成混淆。F1

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.