概要
您已重新发现样本中位数的中心极限定理中描述的结构的一部分,该原理说明了样本中位数的分析。(该分析显然比照适用于所有分位数,而不仅仅是中位数)。因此,对于较大的Beta参数(对应于较大的样本),在问题中描述的变换下会出现正态分布也就不足为奇了。有趣的是,即使对于较小的 Beta参数,分布也接近于正态分布。 值得解释。
我将在下面进行分析。为了使这篇文章保持适当的长度,它涉及很多建议性的挥手:我只是想指出关键思想。因此,让我在这里总结一下结果:
当接近β时,一切都是对称的。这使转换后的分布看起来已经很正常。αβ
形式的功能看在第一位置相当正常,即使对于小的值α和β(提供均超过1和它们的比率是不太接近0或1)。Φα−1(x)(1−Φ(x))β−1αβ101
变换后的分布的表观正态性是由于以下事实:其密度包括正态密度乘以(2)中的函数。
随着和β的增加,可以从对数密度的泰勒级数的余项中测量出偏离正态性。的顺序的术语Ñ正比于下降(Ñ - 2 )/ 2的幂α和β。这意味着最终,对于足够大的α和β,所有幂n = 3或更大的项都变得相对较小,仅剩下二次方:这恰好是正态分布的对数密度。αβn(n−2)/2αβαβn=3
总的来说,这些行为很好地解释了为什么即使对于较小的和β,同构正态样本的非极端分位数也看起来近似于正态。αβ
分析
尽管可以将F = Φ记为F,但由于将其归纳是有用的,因此使为任意分布函数。FF=Φ
根据定义,Beta (α ,β )变量的密度函数与g(y)(α,β)
yα−1(1−y)β−1dy.
让是概率积分变换的X和写入˚F的衍生物的˚F,它是直接的是X的密度成比例y=F(x)xfFx
G(x;α,β)=F(x)α−1(1−F(x))β−1f(x)dx.
因为这是强单峰分布(β)的单调变换,所以除非非常奇怪,否则变换后的分布也将是单峰的。要研究其与法线的接近程度,让我们检查其密度的对数,F
logG(x;α,β)=(α−1)logF(x)+(β−1)log(1−F(x))+logf(x)+C(1)
其中是不相关的归一化常数。C
展开泰勒级数中的的分量,以围绕值x 0(将接近于模式)将3排序。例如,我们可以将log F的扩展写为logG(x;α,β)x0logF
logF(x)=cF0+cF1(x−x0)+cF2(x−x0)2+cF3h3
对于一些与| h | ≤ | x − x 0 | 。对log (1 - F )和log f使用类似的表示法。 h|h|≤|x−x0|log(1−F)logf
线性项
因此,的线性项变为(1)
g1(α,β)=(α−1)cF1+(β−1)c1−F1+cf1.
当为G (x0,该表达式为零。注意,因为系数是 x 0的连续函数,所以随着 α和 β的变化,模式 x 0也将连续变化。而且,一旦 α和 β足够大,则 c f 1项变得相对无关紧要。如果我们的目标是研究极限 α →交通∞和 β →交通∞针对 α :β在不断的比例停留 γG(;α,β)x0αβx0αβcf1α→∞β→∞ α:βγ,我们可能因此一劳永逸选择一个基准点的这x0
γcF1+c1−F1=0.
一个很好的情况是,其中α = β,F大约对称于0。在这种情况下,很明显X 0 = ˚F (0 )= 1 / 2。γ=1α=βF0x0=F(0)=1/2
我们已经实现了一种方法,其中(a)在极限中,泰勒级数的一阶项消失,并且(b)在刚刚描述的特殊情况下,一阶项始终为零。
二次项
这些是总和
g2(α,β)=(α−1)cF2+(β−1)c1−F2+cf2.
相对于一个正态分布,其二次项是,我们可以估计- 1 /(2 克2(α ,β ))是近似的方差ģ。让我们通过按x的平方根缩放比例来标准化G。我们真的不需要细节;足以理解此重新缩放将乘以(x−(1/2)(x−x0)2/σ2−1/(2g2(α,β))GGx在由泰勒展开(- 1 /(2 克2(α ,β )))ñ / 2。(x−x0)n(−1/(2g2(α,β)))n/2.
剩余期限
重点是:根据我们的记号,泰勒展开式中的阶数项是n
gn(α,β)=(α−1)cFn+(β−1)c1−Fn+cfn.
标准化后,变为
g′n(α,β)=gn(α,β)(−2g2(α,β))n/2).
两个都是α和β的仿射组合。通过将分母提高到n / 2次方,净行为在α和β中的阶数均为- (n - 2 )/ 2。随着这些参数变大,第二个泰勒展开式中的每个项在第二个之后渐近减小为零。 特别地,三阶余项变得任意小。giαβn/2−(n−2)/2αβ
当案件是正常的F
当为标准正态时,余项的消失特别快,因为在这种情况下,f (x )纯粹是二次的:它对余项没有任何贡献。因此,偏差ģ从常态仅取决于之间的偏差˚F α - 1(1 - ˚F )β - 1和正常性。Ff(x)GFα−1(1−F)β−1
This deviation is fairly small even for small α and β. To illustrate, consider the case α=β. G is symmetric, whence the order-3 term vanishes altogether. The remainder is of order 4 in x−x0=x.
Here is a plot showing how the standardized fourth order term changes with small values of α>1:
The value starts out at 0 for α=β=1, because then the distribution obviously is Normal (Φ−1 applied to a uniform distribution, which is what Beta(1,1) is, gives a standard Normal distribution). Although it increases rapidly, it tops off at less than 0.008--which is practically indistinguishable from zero. After that the asymptotic reciprocal decay kicks in, making the distribution ever closer to Normal as α increases beyond 2.