Questions tagged «order-statistics»

样本的顺序统计信息是按升序排列的值。统计样本的第i阶统计量等于其第i个最小值;因此样本最小值是一阶统计量,样本最大值是最后一阶统计量。有时,“订单统计量”用于表示整个订单统计量,即不考虑其发生顺序的数据值。也可用于相关数量,例如间距。

2
转换订单统计
假设随机变量和是独立的并且是。证明Z_n = n \ log \ frac {\ max(Y _ {(n)},X _ {(n)})} {\ min(Y _ {(n)},X _ {(n)})}的\文本{Exp}(1)分发。X1,...,XnX1,...,XnX_1, ... , X_nY1,...,YnY1,...,YnY_1, ..., Y_nU(0,a)U(0,a)U(0,a)Zn=nlogmax(Y(n),X(n))min(Y(n),X(n))Zn=nlog⁡max(Y(n),X(n))min(Y(n),X(n))Z_n= n\log\frac{\max(Y_{(n)},X_{(n)})}{\min(Y_{(n)},X_{(n)})}Exp(1)Exp(1)\text{Exp}(1) 我通过设置\ {X_1,...,X_n,Y_1,... Y_n \} = \ {Z_1,...,Z_n \}开始了这个问题,{X1,...,Xn,Y1,...Yn}={Z1,...,Zn}{X1,...,Xn,Y1,...Yn}={Z1,...,Zn}\{X_1,...,X_n,Y_1,...Y_n\} = \{Z_1,...,Z_n\}然后max(Yn,Xn)=Z(2n)max(Yn,Xn)=Z(2n)\max(Y_n,X_n)= Z_{(2n)}分布为(za)2n(za)2n(\frac{z}{a})^{2n}而min(Yn,Xn)=Z(1)min(Yn,Xn)=Z(1)\min(Y_n,X_n)= Z_{(1)}分布为1−(1−za)2n1−(1−za)2n1 - (1 - \frac{z}{a})^{2n} 可以很容易地找到密度,因为fZ1(z)=(2n)(1−za)2n−11afZ1(z)=(2n)(1−za)2n−11af_{Z_{1}}(z) = (2n)(1-\frac{z}{a})^{2n-1}\frac{1}{a}和fZ(2n)(z)=(2n)(za)2n−11afZ(2n)(z)=(2n)(za)2n−11af_{Z_{(2n)}}(z) = (2n)(\frac{z}{a})^{2n-1} \frac{1}{a} 现在,在计算完这些之后,我很难知道下一步要去哪里。我以为它必须进行某种转换,但是我不确定...

1
重尾分布阶数统计量的渐近正态性
背景: 我有一个要在尾部分布较大的情况下建模的样本。我有一些极端的值,以至于观察值的分布相对较大。我的想法是使用广义Pareto分布对此建模,所以我做到了。现在,我的经验数据的0.975分位数(约100个数据点)低于我拟合到我的数据的广义帕累托分布的0.975分位数。我想,现在有什么方法可以检查这种差异是否值得担心吗? 我们知道分位数的渐近分布为: 因此,我认为通过尝试在广义Pareto分布的0.975分位数附近绘制95%的置信带,并使用与我拟合数据时得到的参数相同的参数来激发我的好奇心是个好主意。 如您所见,我们在这里使用一些极限值。而且由于分布是如此之大,因此密度函数的值非常小,使用上面的渐近正态性公式的方差使置信带达到的数量级:± 1012±1012\pm 10^{12} ± 1.96 0.975 * 0.025Ñ (˚Fg ^ Pd(q0.975))2±1.960.975∗0.025ñ(FGPd(q0.975))2\pm 1.96\frac{0.975*0.025}{n({f_{GPD}(q_{0.975})})^2} 因此,这没有任何意义。我的分布只有积极的结果,而置信区间包括负值。所以这里发生了一些事情。如果我计算0.5分位数附近的谱带,则谱带并不是那么大,但仍然很大。 我继续看一下如何与另一个分布,即分布一起使用。从分布模拟观测值,并检查分位数是否在置信带内。我这样做了10000次,以查看置信区间内模拟观察值的0.975 / 0.5分位数的比例。ñ(1 ,1 )ñ(1个,1个)\mathcal{N}(1,1)n = 100ñ=100n=100ñ(1 ,1 )ñ(1个,1个)\mathcal{N}(1,1) ################################################ # Test at the 0.975 quantile ################################################ #normal(1,1) #find 0.975 quantile q_norm<-qnorm(0.975, mean=1, sd=1) #find density value at 97.5 quantile: f_norm<-dnorm(q_norm, mean=1, sd=1) …

1
正常样本的最小订单统计量的期望值
2014年1月25日更新: 错误已得到纠正。请忽略上载图像中的“期望值”的计算值-它们是错误的-我不会删除图像,因为它已经生成了该问题的答案。 2014年1月10日更新: 发现了错误-所使用的一种来源中存在数学错字。正在准备更正... 从集合的最低次序统计的密度 IID连续随机变量与CDF和pdf是 ñnnFX(x )FX(x)F_X(x)FX(x )fX(x)f_X(x)FX(1 )(X(1 ))= nFX(X(1 ))[ 1 -FX(X(1 ))]n − 1[ 1 ]fX(1)(x(1))=nfX(x(1))[1−FX(x(1))]n−1[1]f_{X_{(1)}}(x_{(1)}) = nf_X(x_{(1)})\left[1-F_X(x_{(1)})\right]^{n-1} \qquad [1] 如果这些随机变量是标准正态的,则 FX(1 )(X(1 ))= n ϕ (X(1 ))[ 1 - Φ (X(1 ))]n − 1= n ϕ (X(1 ))[ Φ (-X(1 ))]n − 1[ 2 ]fX(1)(x(1))=nϕ(x(1))[1−Φ(x(1))]n−1=nϕ(x(1))[Φ(−x(1))]n−1[2]f_{X_{(1)}}(x_{(1)}) …

1
如何计算以获得均匀分布的阶次统计?
我正在尝试为自己的论文解决一个问题,但是我不知道该怎么做。我从均匀分布中随机抽取4个观察值。我想计算的概率。 是第i个顺序统计量(我采用该顺序统计量,以便我的观察结果从最小到最大排列)。我已经为一个简单的案例解决了它,但是在这里我迷失了如何去做。(0,1)(0,1)(0,1)3X(1)≥X(2)+X(3)3X(1)≥X(2)+X(3)3 X_{(1)}\ge X_{(2)}+X_{(3)}X(i)X(i)X_{(i)} 欢迎所有帮助。

2
根据混合顺序分配“未混合”零件
假设我已将成对iid的观测值配对为对于。令和表示由的Ĵ的第最大观测值ž。X_ {i_j}的(条件)分布是什么?(或等效地,Y_ {i_j}的值)Xi∼N(0,σ2x),Yi∼N(0,σ2y),Xi∼N(0,σx2),Yi∼N(0,σy2),X_i \sim \mathcal{N}\left(0,\sigma_x^2\right), Y_i \sim \mathcal{N}\left(0,\sigma_y^2\right),i=1,2,…,ni=1,2,…,ni=1,2,\ldots,nZi=Xi+Yi,Zi=Xi+Yi,Z_i = X_i + Y_i,ZijZijZ_{i_j}jjjZZZXijXijX_{i_j}YijYijY_{i_j} 也就是说,在Z_i是Z的n个观测值的第j大时,X_i的分布是什么?XiXiX_iZiZiZ_ijjjnnnZZZ 我猜想,当ρ=σxσy→0ρ=σxσy→0\rho = \frac{\sigma_x}{\sigma_y} \to 0,X_ {i_j}的分布XijXijX_{i_j}收敛为X的无条件分布XXX,而当ρ→∞ρ→∞\rho \to \infty,X的分布XijXijX_{i_j}收敛到X的jjj阶统计量的无条件分布。不过在中间,我不确定。XXX

4
如何在2 X 3桌子上进行多个事后卡方检验?
我的数据集包括近海,中海道和近海三种地点类型的生物的总死亡率或生存率。下表中的数字表示站点数。 100% Mortality 100% Survival Inshore 30 31 Midchannel 10 20 Offshore 1 10 我想知道根据地点​​类型,发生100%死亡率的地点数量是否显着。如果我运行2 x 3卡方,则会得到显着的结果。我是否可以进行事后成对比较,或者实际上应该使用对数方差分析或二项分布的回归?谢谢!
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.