高斯分布样本峰度分布的封闭形式表示


10

从高斯分布采样的数据的峰度分布是否存在封闭形式的表达式?即

P(K^<a)其中是样本峰度。K^


2
峰度示例由封闭形式的表达式给出;有不同的公式,但我从未见过要使用哪个公式取决于您认为的分布。也许您的意思是说从高斯抽样时,峰度的概率密度函数有一个封闭形式的表达吗?
Nick Cox 2014年

非常抱歉,我的意思是样本峰度的分布,而不是样本峰度本身。
yoki 2014年

感谢您的澄清。更简单地说,请参见例如meta.stats.stackexchange.com/questions/1479/…,在此无需感谢他人,等等。只需提出问题!
尼克·考克斯

Answers:


11

确切的采样分布很难获得。出现了前几个时刻(可追溯到1929年),各种近似值(可追溯到1960年代初)和表格(通常基于模拟)(可追溯到1960年代)。

更具体:

Fisher(1929)给出了正常样本中偏度和峰度采样分布的矩,而Pearson(1930)(也)给出了偏度和峰度的采样分布的前四个矩,并提出了基于它们的检验。

因此,例如:

E(b2)=3(n1)n+1

Var(b2)=24n(n2)(n3)(n+1)2(n+3)(n+5)

的偏度为b2216n(129n+519n27637n3+)

峰度为。b2540n20196n2+470412n3+

*注意-力矩值等等取决于所使用的峰度的确切定义。例如,如果您看到或公式不同,则通常是由于样品峰度的定义略有不同。E(b2)Var(b2)

在这种情况下,以上公式应适用于 。b2=ni(XiX¯)4(i(XiX¯)2)2

Pearson(1963)讨论了通过Pearson IV型或Johnson分布近似估计正常样品中峰度的采样分布(无疑,三十年前给出的前四个矩在很大程度上是为了利用Pearson家族) 。SU

Pearson(1965)给出了某些值的峰度百分位数表。n

D'Agostino和Tietjen(1971)给出了峰度百分位数的更广泛的表。

D'Agostino和Pearson(1973)给出了峰度百分比图,该峰度再次涵盖了更广泛的病例。

Fisher,RA(1929),
“抽样分布的矩和乘积矩”
,伦敦数学学会学报,系列2,30:199-238。

Pearson,ES,(1930年),
“正常性测试的进一步发展”,
Biometrika22(1-2),239-249。

皮尔逊,ES(1963)
“ 在近似于概率分布,使用时刻,所产生的一些问题”
Biometrika50,95-112

皮尔逊,ES(1965)
“ 的百分点表和正常样品在:A四舍五入,” Biometrika52,282-285b1b2

达戈斯蒂诺,RB和Tietjen,GL(1971年),
“ 模拟概率点为小样本,” Biometrika58,669-672。b2

达戈斯蒂诺,RB,和Pearson,ES(1973),
“ 试验从正常偏离。对于分布经验结果和,” Biometrika60,613-622。b2b1


6

正常样本的样本峰度近似为零均值正态分布,方差,其中是样本大小(自然地,越大,逼近度越好。方差的更复杂表达式可以是在Wikipedia页面上找到)。对于小尺寸(<40)的高斯样本,本文已得出百分位数:Lacher,DA(1989)。偏度和峰度的采样分布。临床化学,35(2),330-331。24/nnn


2
n在法线逼近变得合理之前,必须适度大。当时,模拟峰度统计可靠地(正)偏斜;他们开始在左右的情况下看起来“正常” 。n=500n>1000
ub
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.