为什么正态分布的峰度是3而不是0


18

正态分布的峰度为3的陈述意味着什么?是否表示在水平线上3的值对应于峰值概率,即3是系统的模式?

当我看一条正态曲线时,似乎峰值出现在中心,也就是0。为什么峰度不是0而是3?


6
正如@Glen_b所写,“峰度”系数已定义为第四标准化时刻: 碰巧的是,对于正态分布,因此。通常用表示的多余峰度是。必须小心,因为有时作者会写“峰度”,它们的意思是“过度峰度”。 μ4=3σ4β2=3
β2=E[(Xμ)4](E[(Xμ)2])2=μ4σ4
μ4=3σ4β2=3γ 2 = β 2普通- 3γ2γ2=β2(Normal)3
Alecos Papadopoulos 2014年

1
回复:我以前的评论。峰度系数过大的正确表达式是
γ2=β2β2(Normal)=β23
Alecos Papadopoulos

Answers:


29

峰态当然不是高峰所在的位置。如您所说,这已经称为模式。

峰度是标准化的第四矩:如果是我们要查看的变量的标准化版本,则峰度是该标准化变量的平均四次方;。样本峰度相应地与一组标准化的样本值的平均四次方相关(在某些情况下,其缩放比例在大样本中为1)。 ÈŽ4Z=XμσËž4

如您所述,在正常随机变量的情况下,第四标准矩为3。正如Alecos在评论中指出的那样,有些人将峰度定义为;有时被称为过度峰度(也是第四累积量)。当看到“峰度”一词时,您需要记住这种可能性,即不同的人使用同一个词来指代两个不同(但密切相关)的数量。Ëž4-3

峰度通常被描述为峰度*(例如,峰的弯曲程度非常大-大概是为了选择“峰度”一词)或重尾(通常人们对使用峰度进行测量感兴趣)实际上,通常的第四标准时刻并不能完全衡量这两个方面。

确实,肯德尔(Kendall)和斯图尔特(Stuart)的第一卷提供了反例,表明较高的峰度不一定与较高的峰(在标准变量中)或较肥大的尾巴相关(以类似的方式,第三时刻并不能完全衡量多少人认为确实如此)。

但是,在许多情况下,两者都有某种趋势,当峰度较高时,往往会出现更大的峰度和沉重的拖尾现象-我们应该提防,这是必然的情况。

峰度和偏度密切相关(峰度必须至少比偏度的平方大1;当分布几乎对称时,对峰度的解释会更容易。

在此处输入图片说明

Darlington(1970)和Moors(1986)表明,峰度的第四矩量度实际上是“肩膀”的变化-,Balanda和MacGillivray(1988)建议以与这种感觉(并考虑其他衡量方法)。如果分布非常集中在,则峰度很小(必要),而如果分布从散开 (这往往会同时将其堆积在中心和将其移到尾巴以将其移离肩膀的可能性),第四时刻峰度会很大。μ ± σ μ ± σμ±σμ±σμ±σ

De Carlo(1997)是阅读峰度的一个合理的起点(在Wikipedia等更基本的资源之后)。

编辑:我偶尔会遇到一些疑问,即较高的峰度(值接近0)是否会完全影响峰度。答案是肯定的。出现这种情况是因为它是标准化变量的第四阶矩-要增加标准化变量的第四阶矩,必须在保持不变的同时增加。这意味着概率进一步移动到尾部必须伴随着进一步的(inside); 反之亦然-如果在将方差保持为1的同时将更多的权重放在中心,则还会在尾部放一些权重。ë Ž 2- 1 1 Ëž4Ëž2 -1个1个

[注:如注解所述,作为一般性陈述,这是不正确的;这里需要一个不同的声明。]

被保持方差这种效应常数直接连接到峭度的如在达林顿和停泊的论文“关于肩部变异”的讨论。这个结果不是一波半波的想法,而是一个简单的数学等价-如果不误解峰度,就不能认为它是相反的。

现在可以在不提升峰值的情况下提高内的概率。同样,有可能增加之外的概率,而不必使远处的尾巴变重(例如,通过某些典型的尾巴指数)。也就是说,在使尾巴变轻的同时提高峰度是很有可能的(例如,在均值的任一侧均具有超过2sds的较轻尾巴)。- 1 1 -1个1个-1个1个

[我将Kendall和Stuart包括在参考文献中是因为他们对峰度的讨论也与此有关。]

那么我们能说什么呢?峰度通常与较高的峰和较重的尾巴相关,而不必枯萎。当然,通过打尾巴来提升峰度会更容易(因为可能会超过1 sd),然后调整中心以使方差保持恒定,但这并不意味着该峰没有影响。它确实可以做到,而人们可以通过专注于峰度来操纵峰度。峰度很大程度上但不仅与尾巴沉重有关-再次,注意肩膀结果的变化;如果是峰态正在研究的东西,那是不可避免的数学意义。

参考文献

Balanda,KP和MacGillivray,HL(1988),
“黑体病:关键评论”。
美国统计学家 42,111-119。

达林顿,理查德·B(Richard B.)(1970年),
《峰变真的是“峰顶”吗?
美国统计学家 24,19-22。

Moors,JJA(1986年),
“峰度的含义:重新检查达林顿”。
美国统计学家 40,283-284。

DeCarlo,LT(1997),
“峰度的含义和使用”。
Psychol。方法2,292-307。

肯德尔(MG)和阿·斯图尔特(A. Stuart),
《高级统计理论》
第1卷。1,第三版
(最近的版本有Stuart和Ord)


有趣的事实:假设“标准”正态分布的峰度为则“标准”拉普拉斯分布的ex为ex。峰度。(+1明显的伟大答案。)303
usεr11852说恢复单胞菌

1
Westfall关于峰度的文章,名为“峰度为峰度”,1905-2014 RIP,值得考虑。它批评德卡洛(其中包括上面所列连)为峰度传播知识作为衡量峰度链接的位置:ncbi.nlm.nih.gov/pmc/articles/PMC4321753
Lil'Lobster

1
@Lil我认为Westfall夸大了他的案子。通过(几乎)完全专注于沉重的尾巴,他是完全错误的。虽然峰度与沉重的尾巴有很强的联系,但峰度显然不是沉重的尾巴(较重的尾巴伴有较低的峰度的反例很容易找到,如上面的某些参考文献所述;它们也很容易制造)。峰度与峰度的关联较小,但是仍然存在关联。他坚持认为这不是峰值,他的批评太过分了(类似的批评也适用于他自己的结论)。... ctd
Glen_b-莫妮卡(Monica)恢复

1
Glen_b,您和我俩都喜欢数学。如果您要批评我“夸大其词”,请给我您的数学论证,将皮尔逊的峰度与“言语”联系起来。
彼得·韦斯特洛夫

1
Gelen_b,您的评论:“这意味着概率向尾部的移动必须伴随着进一步的内部mu + -sigma的反之,反之亦然-如果您在将方差保持为1的同时将更多的权重放在中心,则也要放一些尾巴出来”是假的。它一定不能。您可以使mu + -sigma内的概率(实际上是整个分布)保持恒定,并在某些参数分布族内将峰度增加到无穷大。在这里看到:math.stackexchange.com/questions/167656/...
彼得·韦斯特福尔

2

这是直接的可视化效果,以了解数字3与正态分布的峰度有关。

令为正态分布,令。令。考虑 pdf的图,。该曲线在零的右边,并延伸至无穷大,其分位数为0.999,为117.2,但是大部分质量接近零;例如,比1.0小68%。Xž=X-μ/σV=ž4VpVv

这种分布的平均值是峰度。理解均值的一种常见方法是将pdf图称为“平衡点”。如果正常,则此曲线 平衡为3.0。XpVv

该表示法也解释了峰度为何可以测量分布尾部的沉重度。如果是非正态的,则当峰度大于3.0时,曲线 “右移”,因此在这种情况下,的密度可以说“比正态分布更重”。 ” 类似地,当峰度小于3.0时,曲线 “落在左侧”,因此在这种情况下,的密度可以说“比正态分布更轻尾”。 XpVvXpVvX

通常认为,较高的峰度是指靠近中心的质量更大(即pdf靠近0的质量 )。尽管在很多情况下是这样,但显然,不是峰值质量(可能会增加)接近零,导致峰度高的情况下图形“向右下降”。相反,它是尾巴杠杆。pVv

从这个角度出发,对峰度的基本正确的“尾巴重量”解释可以更具体地描述为“尾巴杠杆”,以避免将“尾巴重量增加”与“尾巴质量增加”混淆。毕竟,较高的峰度可能对应于尾巴中较小的质量,但是在这种情况下,减小的质量占据了更远的位置。

“给我站立的地方,我将移动地球。” -阿基米德人

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.