任何连续随机数的ith阶统计量的分布PDF的变量由“β-F”化合物分布给出。考虑这种分布的直观方法是在的样本中考虑第i阶统计量。现在,为了使随机变量的第i次统计量的值等于我们需要3个条件:
NXx
- i−1值低于,则每个观测值的概率为,其中是随机变量X的CDF。xFX(x)FX(x)=Pr(X<x)
- N−i值高于,则概率为x1−FX(x)
- 在包含的无穷间内的1个值,其概率为,其中为随机变量的PDFxfX(x)dxfX(x)dx=dFX(x)=Pr(x<X<x+dx)X
有种方法可以进行此选择,因此我们有:(N1)(N−1i−1)
fi(xi)=N!(i−1)!(N−i)!fX(xi)[1−FX(xi)]N−i[FX(xi)]i−1dx
在我的原始帖子中进行编辑,从这一点出发,我做了很差的尝试,下面的评论反映了这一点。我试图在下面纠正此问题
如果我们取该pdf的平均值,则得到:
E(Xi)=∫∞−∞xifi(xi)dxi
然后在此积分中,对变量进行以下更改(采用@henry的提示),积分变为:pi=FX(xi)
E(Xi)=∫10F−1X(pi)Beta(pi|i,N−i+1)dpi=EBeta(pi|i,N−i+1)[F−1X(pi)]
因此,这是反CDF的期望值,可以使用delta方法很好地近似得出:
EBeta(pi|i,N−i+1)[F−1X(pi)]≈F−1X[EBeta(pi|i,N−i+1)]=F−1X[iN+1]
为了获得更好的近似值,我们可以扩展到二阶(素数表示微分),并指出反数的二阶导数是:
∂2∂a2F−1X(a)=−F′′X(F−1X(a))[F′X(F−1X(a))]3=−f′X(F−1X(a))[fX(F−1X(a))]3
令。然后我们有:νi=F−1X[iN+1]
EBeta(pi|i,N−i+1)[F−1X(pi)]≈F−1X[νi]−VarBeta(pi|i,N−i+1)[pi]2f′X(νi)[fX(νi)]3
=νi−(iN+1)(1−iN+1)2(N+2)f′X(νi)[fX(νi)]3
现在,针对正常情况,我们有
fX(x)=1σϕ(x−μσ)→f′X(x)=−x−μσ3ϕ(x−μσ)=−x−μσ2fX(x)
FX(x)=Φ(x−μσ)⟹F−1X(x)=μ+σΦ−1(x)
请注意,,期望大约变为:fX(νi)=1σϕ[Φ−1(iN+1)]
E[xi]≈μ+σΦ−1(iN+1)+(iN+1)(1−iN+1)2(N+2)σΦ−1(iN+1)[ϕ[Φ−1(iN+1)]]2
最后:
E[xi]≈μ+σΦ−1(iN+1)⎡⎣⎢⎢1+(iN+1)(1−iN+1)2(N+2)[ϕ[Φ−1(iN+1)]]2⎤⎦⎥⎥
尽管正如@whuber所指出的那样,这在末尾将是不准确的。实际上,我认为情况可能更糟,因为带有不同参数的beta的偏度