将法线除以可得出t分布-证明


10

让和。w ^ χ 2小号ZN(0,1)Wχ2(s)

如果和独立分布,则变量遵循自由度的分布。W Y = ZZW小号Y=ZW/sts

我正在寻找这一事实的证明,如果您不想写下完整的参数,那么引用就足够了。


1
stats.stackexchange.com/questions/52906上已正式证明了这一点:该比率以整数形式书写时,被视为是高斯的混合,并且该演示表明该混合处于分布状态。
ub

在某些教科书中,这是t分布的定义。您无需证明。给定这样的定义,如何导出pdf是一个有效的问题。
mpiktas 2015年

Answers:


12

令为具有自由度的卡方随机变量。然后的平方根,分布作为一个卡分配与自由度,其具有密度 ñ Ÿ YnY Ñ ˚F ýÝ= 2 1 - ÑYY^n

(1)fY^(y^)=21n2Γ(n2)y^n1exp{y^22}

定义。然后,通过变量变化公式,我们得到 ÿX1nY^Y^X=n

fX(x)=fY^(nx)|Y^X|=21n2Γ(n2)(nx)n1exp{(nx)22}n

(2)=21n2Γ(n2)nn2xn1exp{n2x2}

令为独立于先前变量的标准普通随机变量,并定义随机变量Z

T=ZYn=ZX

通过两个独立随机变量之比的密度函数的标准公式,

fT(t)=|x|fZ(xt)fX(x)dx

但是对于间隔,因为是一个非负rv,因此我们可以消除绝对值,并将积分减小为[ - 0 ] XfX(x)=0[,0]X

fT(t)=0xfZ(xt)fX(x)dx

=0x12πexp{(xt)22}21n2Γ(n2)nn2xn1exp{n2x2}dx

(3)=12π21n2Γ(n2)nn20xnexp{12(n+t2)x2}dx

的被积数有望最终转换为Gamma密度函数。积分的极限是正确的,因此我们需要在不改变极限的情况下操纵被积分体成为Gamma密度函数。定义变量(3)

mx2dm=2xdxdx=dm2x,x=m12
在被积物中进行替换

(4)I3=0xnexp{12(n+t2)m}dm2x=120mn12exp{12(n+t2)m}dm

伽玛密度可以写成

Gamma(m;k,θ)=mk1exp{mθ}θkΓ(k)

匹配系数,我们必须有

k1=n12k=n+12,1θ=12(n+t2)θ=2(n+t2)

对于和的这些值,被积中涉及变量的项是伽玛密度的核。因此,如果我们将被积除以并在积分之外乘以相同的大小,则该积分将为gamma distr。功能,将等于统一。因此我们到达了θ θ k Γ k kθ(θ)kΓ(k)

I3=12(θ)kΓ(k)=12(2n+t2)n+12Γ(n+12)=2n12nn+12Γ(n+12)(1+t2n)12(n+1)

将以上内容插入到等式中。我们得到(3)

fT(t)=12π21n2Γ(n2)nn22n12nn+12Γ(n+12)(1+t2n)12(n+1)

=Γ[(n+1)/2]nπΓ(n/2)(1+t2n)12(n+1)

...这就是所谓的学生t分布的(密度函数),具有个自由度。n


23

尽管ES Pearson不喜欢它,但Fisher的原始观点是几何,简单,令人信服和严格的。 它依赖于少量直观且易于确定的事实。当或,它们很容易可视化,其中几何可以二维或三维可视化。实际上,这等于使用圆柱坐标来分析 iid法向变量。s=1s=2Rs×Rs+1

  1. s+1独立且分布均匀的正态变量是球形对称的。这意味着点在单位球上的径向投影在上具有均匀分布。X1,,Xs+1(X1,,Xs+1)SsRs+1Ss

  2. 甲分布是,平方和的独立标准普通个变量。χ2(s)s

  3. 因此,设置且,则比率是该点的纬度的正切值在。Z=Xs+1W=X12++Xs2Z/Wθ(X1,,Xs,Xs+1)Rs+1

  4. tanθ通过径向投影到不变。Ss

  5. 由上所有纬度确定的集合是半径为的维球面。因此,它的维度量与成比例θSss1cosθs1

    coss1θ=(1+tan2θ)(s1)/2.

  6. 微分元素为。d(tanθ)=cos2θdθ=(1+tan2θ)dθ

  7. 写得出,其中和 这些等式一起暗示将因子纳入归一化常数,可知的密度与t=Z/W/s=stanθtanθ=t/s

    1+t2/s=1+tan2θ
    dt=sdtanθ=s(1+tan2θ)dθ.
    dθ=1s(1+t2/s)1dt.
    1/sC(s)t

    (1+tan2θ)(s1)/2dθ=(1+t2/s)(s1)/2 (1+t2/s)1dt=(1+t2/s)(s+1)/2dt.

那就是学生t密度。

数字

该图描绘的上半球(与)的在。交叉的轴跨过超平面。黑点是变量标准正态分布的随机样本的一部分:黑点是投影到给定纬度的常数的值,显示为黄色带。这些点的密度与该带的维体积成正比,其本身就是半径的。绘制该带上的圆锥以终止于的高度。最多Z0SsRs+1Ws+1θs1Ss1θtanθs与学生t分布自由度是该高度的分布由黄色带的度量归一化后的单位球体的面积加权的统一。sSs

顺便说一句,归一化常数必须为(如前所述)乘以球体的相对体积1/s

C(s)=1s|Ss1||Ss|=1ssπs/2Γ(s+12+1)(s+1)π(s+1)/2Γ(s2+1)=1ssπs/2(s+1)/2Γ(s+12)(s+1)π(s+1)/2(s/2)Γ(s2)=Γ(s+12)sπΓ(s2).

最终的表达,虽然常规的,略微伪装完美的简单初始表达,这清楚地揭示了含义的。C(s)


费舍尔在一封信中向WS Gosset(原始的“学生”)解释了这种派生。戈塞特(Gosset)试图出版该书,使费舍尔(Fisher)受到充分肯定,但皮尔森(Pearson)拒绝了该论文。费希尔方法最终应用于发现样本相关系数分布的基本相似但更为困难的问题。

参考文献

RA Fisher,无限大样本群体中相关系数值的频率分布。 Biometrika 卷 第10卷,第4期(1915年5月),第507-521页。可以从以下网址获取: https://stat.duke.edu/courses/Spring05/sta215/lec/Fish1915.pdf(以及在许多其他地方通过搜索,一旦此链接消失)。

Joan Fisher Box,Gosset,Fisher和t分布。 美国统计员卷。35,第2号(1981年5月),第61-66页。可以从以下网址获得Web:http://social.rollins.edu/wpsites/bio342spr13/files/2015/03/Studentttest.pdf

EL Lehmann,Fisher,Neyman和古典统计学的创立。 Springer(2011),第2章。


这是一个绝妙的证明!我衷心希望您能找到这条消息,尽管已经有好几年了。在此证明的第六步中,我相信有一个错误。Cos ^-2θ=(1 + tan ^2θ),而不是倒数。祈祷有一个简单的解决方法?
数学发烧友

@Math谢谢您的发言。我在第6步没有发现任何错误。也许您正在尝试阅读“ ”(这意味着的幂),就好像是在读“ “?cos2(θ)2cos(θ)(ArcCos(θ))2
whuber

1
我用简单的身份推断出在第5行但是,通过第6行中的相同推理, 。这与微分元素等于的说法相矛盾sec2θ=tan2θ+1cosθ=(tan2θ+1)1/2cos2θ=sec2θ=(tan2θ+1)(tan2θ+1)1
Math Enthusiast

@Math谢谢您-当然,您是对的。我已经编辑了点(6)和(7)来校正代数。
whuber

1
哇,真是舒心!祝您节日快乐
数学爱好者

1

我会尝试更改变量。组和例如。所以,。然后。其中为的多元函数的雅可比矩阵和的和。然后,您可以从关节密度中积分出。,,,以及 X=ZZ=XW=sX2Y=ZWsX=ZZ=XW=sX2Y2fX,Y(x,y)=fZ,W(x,sx2y2)|det(J)|JZWXYxZX=1ZY=0WX=2sXY2WY=2sX2Y3

J=(102sX2Y3)

因此。我只是拍了一下托马斯A.塞韦里尼分配理论的元素还有,他们采取。使用Gaama分布的属性,可以使集成起来变得更加容易。如果使用,则可能需要完成正方形。|det(J)|=2sx2y3X=WX=Z

但是我不想做计算。


1
我没有给你投票,实际上我只是给你投票。但是我认为也许在您进行编辑之前就已经有了反对意见。
Monolite

抱歉,从现在开始我会小心的。
ztyh 2015年
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.