是否存在用于某些随机分布的顺序统计的众所周知的公式?特别是正常随机变量的一阶和最后一阶统计量,但也可以理解为更通用的答案。
编辑:为澄清起见,我正在寻找可以或多或少明确评估的近似公式,而不是确切的整数表达式。
例如,对于正常rv的一阶统计量(即最小值),我已经看到以下两个近似值:
和
其中第一个,对于,给出大约,这似乎是一个松散的界限。
第二个给出而快速的Monte Carlo给出,所以这并不是一个很差的近似值,但也不是很好,并且更重要的是,我对它的来源一无所知。
有什么帮助吗?
是否存在用于某些随机分布的顺序统计的众所周知的公式?特别是正常随机变量的一阶和最后一阶统计量,但也可以理解为更通用的答案。
编辑:为澄清起见,我正在寻找可以或多或少明确评估的近似公式,而不是确切的整数表达式。
例如,对于正常rv的一阶统计量(即最小值),我已经看到以下两个近似值:
和
其中第一个,对于,给出大约,这似乎是一个松散的界限。
第二个给出而快速的Monte Carlo给出,所以这并不是一个很差的近似值,但也不是很好,并且更重要的是,我对它的来源一无所知。
有什么帮助吗?
Answers:
经典的参考文献是Royston(1982)[1],它的算法超出了明确的公式。它还引用了Blom(1958)的一个著名公式: 与。对于此公式给出-2.73的乘数。α=0.375Ñ=200,[R=1
[1]:算法AS 177:预期的正常订单统计信息(精确和近似) JP Royston。皇家统计学会杂志。系列C(应用统计信息)第一卷 31,No. 2(1982),pp.161-165
有种方法可以进行此选择,因此我们有:
在我的原始帖子中进行编辑,从这一点出发,我做了很差的尝试,下面的评论反映了这一点。我试图在下面纠正此问题
如果我们取该pdf的平均值,则得到:
然后在此积分中,对变量进行以下更改(采用@henry的提示),积分变为:
因此,这是反CDF的期望值,可以使用delta方法很好地近似得出:
为了获得更好的近似值,我们可以扩展到二阶(素数表示微分),并指出反数的二阶导数是:
令。然后我们有:
现在,针对正常情况,我们有
请注意,,期望大约变为:
最后:
尽管正如@whuber所指出的那样,这在末尾将是不准确的。实际上,我认为情况可能更糟,因为带有不同参数的beta的偏度
Aniko的答案依赖于Blom众所周知的公式,其中涉及的选择。事实证明,由于G. Elfving(1947),正常人口样本中范围的渐近分布,Biometrika,Vol。1 ,该公式本身仅是精确答案的近似值。34,第111-119页。Elfving的公式针对的是样本的最小值和最大值,对于alpha的正确选择是。当我们将近似为时,将得出Blom公式。
通过使用Elfving公式而不是Blom逼近,我们得到的乘数为-2.744165。这个数字比Blom的近似值(-2.73)更接近Erik P.的精确答案(-2.746)和蒙特卡洛近似(-2.75),但比精确的公式更容易实现。
根据您要执行的操作,此答案可能有帮助也可能没有帮助-我从Maple的Statistics软件包中获得了以下确切公式。
with(Statistics):
X := OrderStatistic(Normal(0, 1), 1, n):
m := Mean(X):
m;
就其本身而言,它不是很有用(由于它是随机变量的最小值,因此可以很容易地手动得出),但是它确实允许对给定的值进行快速,非常准确的近似-比精确得多蒙特卡洛:
evalf(eval(m, n = 200));
evalf[25](eval(m, n = 200));
分别给出-2.746042447和-2.746042447451154492412344。
(完整披露-我维护此程序包。)