1
重尾分布阶数统计量的渐近正态性
背景: 我有一个要在尾部分布较大的情况下建模的样本。我有一些极端的值,以至于观察值的分布相对较大。我的想法是使用广义Pareto分布对此建模,所以我做到了。现在,我的经验数据的0.975分位数(约100个数据点)低于我拟合到我的数据的广义帕累托分布的0.975分位数。我想,现在有什么方法可以检查这种差异是否值得担心吗? 我们知道分位数的渐近分布为: 因此,我认为通过尝试在广义Pareto分布的0.975分位数附近绘制95%的置信带,并使用与我拟合数据时得到的参数相同的参数来激发我的好奇心是个好主意。 如您所见,我们在这里使用一些极限值。而且由于分布是如此之大,因此密度函数的值非常小,使用上面的渐近正态性公式的方差使置信带达到的数量级:± 1012±1012\pm 10^{12} ± 1.96 0.975 * 0.025Ñ (˚Fg ^ Pd(q0.975))2±1.960.975∗0.025ñ(FGPd(q0.975))2\pm 1.96\frac{0.975*0.025}{n({f_{GPD}(q_{0.975})})^2} 因此,这没有任何意义。我的分布只有积极的结果,而置信区间包括负值。所以这里发生了一些事情。如果我计算0.5分位数附近的谱带,则谱带并不是那么大,但仍然很大。 我继续看一下如何与另一个分布,即分布一起使用。从分布模拟观测值,并检查分位数是否在置信带内。我这样做了10000次,以查看置信区间内模拟观察值的0.975 / 0.5分位数的比例。ñ(1 ,1 )ñ(1个,1个)\mathcal{N}(1,1)n = 100ñ=100n=100ñ(1 ,1 )ñ(1个,1个)\mathcal{N}(1,1) ################################################ # Test at the 0.975 quantile ################################################ #normal(1,1) #find 0.975 quantile q_norm<-qnorm(0.975, mean=1, sd=1) #find density value at 97.5 quantile: f_norm<-dnorm(q_norm, mean=1, sd=1) …