极值理论-显示:从正常到冈贝尔


21

的最大值 simiid根据极值理论,标准正态收敛于标准Gumbel分布。X1,,Xn.

我们如何证明这一点?

我们有

P(maxXix)=P(X1x,,Xnx)=P(X1x)P(Xnx)=F(x)n

我们需要查找/选择常数的序列,以便:F \ left(a_n x + b_n \ right)^ n \ rightarrow ^ {n \ rightarrow \ infty} G(x )= e ^ {-\ exp(-x)}an>0,bnR

F(anx+bn)nnG(x)=eexp(x)

您能解决它还是在文学中找到它?

有一些示例pg.6 / 71,但对于普通情况没有:

Φ(anx+bn)n=(12πanx+bney22dy)neexp(x)

Answers:


23

一种间接方法如下:
对于绝对连续的发行版,理查德·冯·米塞斯(Richard von Mises,理查德·冯·米塞斯(Richard von Mises)(在1936年发表的论文“ La distribution de la plus grande de n valeurs”中似乎用英语?)在1964年版中选中他的论文)提供了以下充分条件,以使样本的最大值收敛到标准Gumbel:G(x)

令为同名随机变量的公共分布函数,而它们的公共密度。那如果F(x)nf(x)

limxF1(1)(ddx(1F(x))f(x))=0X(n)dG(x)

使用标准法线的常用符号并计算导数,我们得到

ddx(1Φ(x))ϕ(x)=ϕ(x)2ϕ(x)(1Φ(x))ϕ(x)2=ϕ(x)ϕ(x)(1Φ(x))ϕ(x)1

注意。同样,对于正态分布,。所以我们必须评估极限ϕ(x)ϕ(x)=xF1(1)=

limx(x(1Φ(x))ϕ(x)1)

但是是密尔的比率,并且我们知道随着增长,标准法线的密尔比率趋于。所以(1Φ(x))ϕ(x)1/xx

limx(x(1Φ(x))ϕ(x)1)=x1x1=0

并且满足充分条件。

相关的级数为

an=1nϕ(bn),bn=Φ1(11/n)

附录

这是从ch。HA David&HN Nagaraja(2003),《订单统计》(第3版),第 10.5页。

ξa=F1(a)。另外,对de Haan的引用是“ Haan,LD(1976)。样本极端:基本介绍。StatisticaNeerlandica,30(4),161-172。 ”但是请注意,因为某些符号在de Haan中具有不同的内容-例如,在书中是概率密度函数,而在德哈恩中,是书中的函数(即密尔比)。另外,德哈恩(De Haan)研究了已经区分的充分条件。f(t) f(t)w(t)

enter image description here


我不确定我是否了解您的解决方案。因此,您将用作标准普通CDF。我遵循并同意满足充分条件。但是,那些突然给定的相关序列和是如何呢?Fanbn
renrenthehamster 2014年

@renrenthehamster我认为这两部分是独立陈述的(没有直接联系)。
emcor 2014年

那么如何获得相关的序列呢?无论如何,我对此问题提出了一个问题(更普遍的是,对于超出标准正态分布的其他分布)
renrenthehamster 2014年

@renrenthehamster我添加了相关材料。我不相信所有情况下都有找到这些系列的标准配方。
Alecos Papadopoulos 2014年

14

这个问题问两件事:(1)在适当选择的序列)(分布)收敛的意义上,如何显示最大收敛和到标准Gumbel分布,以及(2)如何找到这样的序列。X(n)(X(n)bn)/an(an)(bn)

第一个是众所周知的,并记录在Fisher-Tippett-Gnedenko定理(FTG)的原始论文中。第二个似乎更困难。这就是这里要解决的问题。

请注意,为澄清此线程其他地方出现的一些断言,

  1. 最大并没有收敛到任何东西:它发散(尽管极为缓慢)。

  2. 关于Gumbel分布似乎有不同的约定。我将采用以下约定:反向 Gumbel分布的CDF在一定程度上取决于范围和位置。适当标准化的iid正态变量最大值收敛到反向的Gumbel分布。1exp(exp(x))


直觉

当与公共分布函数相等时,最大为XiFX(n)

Fn(x)=Pr(X(n)x)=Pr(X1x)Pr(X2x)Pr(Xnx)=Fn(x).

当的支撑没有上限时(如正态分布一样),函数的序列将永远无限制地向右移动:FFn

图1

示出了对于的局部图。Fnn=1,2,22,24,28,216

要研究这些分布的形状,我们可以将每个分布向左移一些bn然后将其重新缩放以使其具有可比性。an

图2

先前的每个图形都已移位,以将其中位数设置为并使其单位长度的四分位数范围。0

FTG断言可以选择序列和以便这些分布函数在每个处逐点收敛到某个(an)(bn)x极值分布,直至规模和位置。当是正态分布时,特定的极限极值分布是反向的Gumbel,直至位置和比例。F


试图通过将标准化为具有单位均值和单位方差来模拟中心极限定理。但是,这是不适当的,部分原因是因为FTG甚至适用于没有第一或第二时刻的(连续)分布。而是使用百分位数(例如中位数)来确定位置,并使用百分位数的差(例如IQR)来确定价差。 (这种通用方法应该可以成功找到和Fnanbn对于任何连续分布。)

对于标准正态分布,这很容易!令。的位数对应于是任意值为其。回顾定义0<q<1FnqxqFn(xq)=qFn(x)=Fn(x),解为

xq;n=F1(q1/n).

因此,我们可以设置

bn=x1/2;n, an=x3/4;nx1/4;n; Gn(x)=Fn(anx+bn).

因为根据构造,的中位数为且其IQR为,所以(这是反向Gumbel的某种形式)的极限值的中位数必须为并且其IQR必须为。假设scale参数为,而location参数为。由于中位数是并且IQR很容易被发现是Gn01Gn01βαα+βloglog(2)β(loglog(4)loglog(4/3)),因此参数必须为

α=loglog2loglog(4/3)loglog(4); β=1loglog(4)loglog(4/3).

这是没有必要的和是恰好这些值:他们只需要接近他们,提供的极限仍是这个逆转Gumbel分布。对标准法向进行简单(但乏味)的分析anbnGnF表明,近似值

an=log((4log2(2))/(log2(43)))22log(n), bn=2log(n)log(log(n))+log(4πlog2(2))22log(n)

可以正常工作(并且尽可能简单)。

图3

淡蓝色的曲线的曲线图部分为使用近似序列和。深红色线用参数和绘制了反转的Gumbel分布。收敛很明显(尽管负的收敛速度明显较慢)。Gnn=2,26,211,216anbnαβx


参考文献

BV Gnedenko,关于随机序列中最大项的极限分布。在Kotz和Johnson中,《统计突破第一册:基础和基本理论》, Springer,1992年。由Norman Johnson译。


@Vossler Alecos帖子中的公式收敛为作为。对于大其行为类似于。an0n(2log(n)log(2π))1/2n
ub

是的,是的,我在发表评论后不久就意识到了这一点,因此我立即将其删除。谢谢!
Vossler '16

@Jess我曾希望这个答案可以理解为显示除其他外没有“ the”公式的内容:和正确公式anbn.
ub

@Jess更好,因为演示替代方法是编写此答案的动机。我不理解您的暗示,认为“写下答案没有用”,因为这显然是我在这里所做的。
ub

@Jess我无法继续进行此对话,因为它完全是单方面的:我尚未认识到我用您的任何描述写过的任何东西。我落后时要退出。
ub
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.