如何计算IID均匀随机变量样本最大值的概率密度函数?


45

给定随机变量

Y=max(X1,X2,,Xn)

其中Xi是IID统一变量,如何计算Y的PDF Y


4
如果这是家庭作业,请阅读常见问题解答并相应地更新您的问题。
主教

能否使用范德蒙德的身份显示2阶统计的联合函数说F_y(r)* G_y(r)?
拉里·明茨

出于兴趣,什么课程涵盖了此类问题?这不是我在工程概率课程中遇到的。
Alex

@Alex关于覆盖重采样的统计课程呢?
SOFe

Answers:


65

这个问题很可能是家庭作业,但是我觉得这个经典的基本概率问题在几个月后仍然缺乏完整的答案,因此我在这里给一个答案。

从问题陈述中,我们希望分配

Y=max{X1,...,Xn}

其中是iid。我们知道,当且仅当样本的每个元素时,。然后,如@varty的提示所示,结合是独立的这一事实,我们可以推断出X1,...,XnUniform(a,b)Y<xxXi

P(Yx)=P(X1x,...,Xnx)=i=1nP(Xix)=FX(x)n

其中是均匀分布CDF。因此,的CDF 为 FX(x)Y

FY(y)=P(Yy)={0ya[(ya)/(ba)]ny(a,b)1yb

由于具有绝对连续的分布,我们可以通过区分CDF来推导其密度。因此的密度为YY

pY(y)=n(ya)n1(ba)n

另外,在特殊情况下,,我们有,这是一种密度Beta分布与和,因为。a=0,b=1pY(y)=nyn1α=nβ=1Beta(n,1)=Γ(n+1)Γ(n)Γ(1)=n!(n1)!=n

值得注意的是,如果要按升序对样本进行排序,则得到的序列 -被称为订单统计。这个答案的一个概括是,分布样本的所有阶次统计量都具有Beta分布,如@bnaul的答案所述。 X(1),...,X(n)Uniform(0,1)


对我来说,这实际上是一个作业问题。感谢您的解释。
Paul PM

我觉得我应该能够在这里获得您的见解并回答这个问题,但是我不知道该怎么做。你能帮我吗?您能推荐一本涉及该一般性问题的教科书或一章吗?

@PaulPM出于兴趣,什么课程可以解决此类问题?这不是我在工程概率课程中遇到的。
Alex

6

样本的最大值是阶次统计之一,尤其是样本第个阶次统计。通常,如Wikipedia文章所述,计算订单统计信息的分布是困难的。对于某些特殊分发,订单统计信息是众所周知的(例如,对于具有Beta分发的订单统计信息的统一分发)。nX1,,Xn

编辑:有关样本最大和最小的Wikipedia文章也很有帮助,并且更加针对您的问题。


5
对于具有密度的分布,计算特定顺序统计量的边际分布非常简单。对于“特殊”订单统计信息(例如最小和最大),甚至更加容易。
主教

我想这取决于原始问题中“计算”的含义。当然,从数字上讲是很简单的。我将问题解释为询问如何找到封闭式解决方案,这通常并不容易。
bnaul 2011年

8
@bnaul:令为任意分布函数,令为的iid样本。假设为第阶统计量。然后QEDF(x)=P(Xx)X1,,XnFX(k)k
P(X(k)x)=m=knP(|{i:Xix}|=m)=m=kn(nm)F(x)m(1F(x))nm.
主教

1
理解基数答案的一种方法(假设您了解统一的订单统计)是因为cdf是统一cdf的单调1到1转换,因此我们总是可以用统一表示事件{X <a}随机变量(这就是蒙特卡洛起作用的原因)。因此,基于均匀分布的任何结果都可以轻松地推广到其他随机变量-只需应用变换。U=FX(X)
概率

2
@probabilityislogic:直觉是很好的,尽管似乎您在注释中考虑了连续的随机变量。(例如,我在上面的第二条评论中的结果适用于任意分布函数。)
主教

1

如果是的CDF ,则 然后可以使用iid属性和均匀变量的cdf以计算。FY(y)Y

FY(y)=Prob(y>X1,y>X2,...,y>Xn)
FY(y)

-3

当适当归一化时,一组IID随机变量的最大值通常会收敛到三种极值类型之一。这就是格涅坚科定理,这是极值中心极限定理的等价形式。具体类型取决于总体分布的尾巴行为。知道这一点,您可以使用限制分布来近似最大分布。

由于[a,b]上的均匀分布是该问题的主题,因此Macro给出了任意n的精确分布,并且给出了一个很好的答案。结果相当琐碎。对于正态分布,不可能有一个很好的封闭形式,但可以将正态的最大值适当归一化为Gumbel分布F(x)= exp(-e)。x

为了统一,归一化为(ba)-x / n和F(bax / n)=(1-x / [n(ba)])nn

收敛到e。注意这里y = bax / n。当y进入ba时,F(y)收敛到1。这适用于所有0 x/(ba)n

在这种情况下,很容易将精确值与其渐近极限进行比较。

冈贝尔的书

加兰博斯的书

Leadbetter的书

诺瓦克的书

科尔斯书


4
为了使该答案切实可行,您需要详细规定如何“适当地归一化”值,并且还需要提供某种方法来估计渐近公式变为可靠逼近之前必须有多少。n
ub

@whuber任何人都可以查看Gnedenko定理,以查看归一化。同样重要的是,确定三种类型中的哪种类型的尾巴特性。该定理推广到平稳随机过程。因此,任何想了解细节的人都可以阅读Leadbetter的书或我的博士学位论文。当n足够大时,对于任何形式的渐近性来说,这都是一个很难回答的问题。我猜想Berry-Esseen定理有助于中心极限定理。我不知道极端情况下的可比性。
Michael Chernick
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.