Answers:
这个问题很可能是家庭作业,但是我觉得这个经典的基本概率问题在几个月后仍然缺乏完整的答案,因此我在这里给一个答案。
从问题陈述中,我们希望分配
其中是iid。我们知道,当且仅当样本的每个元素时,。然后,如@varty的提示所示,结合是独立的这一事实,我们可以推断出
由于具有绝对连续的分布,我们可以通过区分CDF来推导其密度。因此的密度为
另外,在特殊情况下,,我们有,这是一种密度Beta分布与和,因为。
值得注意的是,如果要按升序对样本进行排序,则得到的序列 -被称为订单统计。这个答案的一个概括是,分布样本的所有阶次统计量都具有Beta分布,如@bnaul的答案所述。
样本的最大值是阶次统计之一,尤其是样本第个阶次统计。通常,如Wikipedia文章所述,计算订单统计信息的分布是困难的。对于某些特殊分发,订单统计信息是众所周知的(例如,对于具有Beta分发的订单统计信息的统一分发)。
编辑:有关样本最大和最小的Wikipedia文章也很有帮助,并且更加针对您的问题。
当适当归一化时,一组IID随机变量的最大值通常会收敛到三种极值类型之一。这就是格涅坚科定理,这是极值中心极限定理的等价形式。具体类型取决于总体分布的尾巴行为。知道这一点,您可以使用限制分布来近似最大分布。
由于[a,b]上的均匀分布是该问题的主题,因此Macro给出了任意n的精确分布,并且给出了一个很好的答案。结果相当琐碎。对于正态分布,不可能有一个很好的封闭形式,但可以将正态的最大值适当归一化为Gumbel分布F(x)= exp(-e)。
为了统一,归一化为(ba)-x / n和F(bax / n)=(1-x / [n(ba)])
收敛到e。注意这里y = bax / n。当y进入ba时,F(y)收敛到1。这适用于所有0
在这种情况下,很容易将精确值与其渐近极限进行比较。