的方差不是有限的。Y X α = 3 / 2 μ ý σ 2 X 我 这是因为具有 3/2(Holtzmark分布)的alpha稳定变量确实具有有限的期望但是其方差是无限的。如果有一个有限的方差,则通过利用的独立性和方差的定义,我们可以计算Xα=3/2μYσ2Xi
σ2=Var(Y)=E(Y2)−E(Y)2=E(X21X22X23)−E(X1X2X3)2=E(X2)3−(E(X)3)2=(Var(X)+E(X)2)3−μ6=(Var(X)+μ2)3−μ6.
这个三次方程至少具有一个实解(最多三个解,但没有更多解),这意味着将是有限的,但不是。这一矛盾证明了这一主张。变量(X )Var(X)Var(X)
让我们转向第二个问题。
随着样本的增加,任何样本的分位数都会收敛到真实的分位数。 接下来的几段证明了这一点。
令关联概率为(或介于和之间的任何其他值,不包括在内)。为分布函数写,使为0 1 F Z q = F − 1(q )q thq=0.0101FZq=F−1(q)qth分位数。
我们只需要假设(分位数函数)是连续的。这向我们保证,对于任何,都存在概率和 ϵ > 0 q − < q q + > qF−1ϵ>0q−<qq+>q为哪些
F(Zq−ϵ)=q−,F(Zq+ϵ)=q+,
并且,间隔的极限为[ q −,q + ] { q }ϵ→0[q−,q+]{q}。
考虑任何大小为 iid样本。此样本中小于的元素数量具有二项式分布,因为每个元素独立地具有小于。中央极限定理(通常是一个!)表示对于足够大的,小于的元素数量由均值和方差(任意近似值)。令标准正态分布的CDF为。该数量超过的机会ž q - (q - ,Ñ )q - ž q - ñ ž q - ñ q - ñ q - (1 - q - )Φ Ñ qnZq−(q−,n)q−Zq−nZq−nq−nq−(1−q−)Φnq 因此任意接近
1−Φ(nq−nq−nq−(1−q−)−−−−−−−−−−√)=1−Φ(n−−√q−q−q−(1−q−)−−−−−−−−−√).
因为右侧上的参数是的固定倍数,所以它随增长而任意增大。由于是CDF,因此其值任意接近,表明此概率的极限值为零。Φn−−√nΦ1
换句话说:在极限范围内,几乎可以肯定的是,样本元素的不小于。一个类似的论点证明几乎肯定是样本元素的不大于。总之,这意味着足够大的样本的分位数极有可能位于和。nqZq−nqZq+qZq−ϵZq+ϵ
这就是我们需要的,以便知道模拟将起作用。 您可以选择任何期望的精度和置信度并且知道对于足够大的样本量,该样本中最接近的顺序统计将至少有处于真分位数。ϵ1−αnnq1−αϵZq
确定模拟将起作用,其余的工作很容易。可以从二项式分布的限制中获得置信度限制,然后进行逆变换。进一步的解释(针对分位数,但适用于所有分位数)可以在样本中位数的中央极限定理的答案中找到。q=0.50
的分位数为负。其采样分布高度偏斜。为了减少偏斜,该图显示了个值的1,000个模拟样本的负数对数的直方图。q=0.01Yn=300Y
library(stabledist)
n <- 3e2
q <- 0.01
n.sim <- 1e3
Y.q <- replicate(n.sim, {
Y <- apply(matrix(rstable(3*n, 3/2, 0, 1, 1), nrow=3), 2, prod) - 1
log(-quantile(Y, 0.01))
})
m <- median(-exp(Y.q))
hist(Y.q, freq=FALSE,
main=paste("Histogram of the", q, "quantile of Y for", n.sim, "iterations" ),
xlab="Log(-Y_q)",
sub=paste("Median is", signif(m, 4),
"Negative log is", signif(log(-m), 4)),
cex.sub=0.8)
abline(v=log(-m), col="Red", lwd=2)