正态分布的峰度为3的陈述意味着什么?是否表示在水平线上3的值对应于峰值概率,即3是系统的模式?
当我看一条正态曲线时,似乎峰值出现在中心,也就是0。为什么峰度不是0而是3?
正态分布的峰度为3的陈述意味着什么?是否表示在水平线上3的值对应于峰值概率,即3是系统的模式?
当我看一条正态曲线时,似乎峰值出现在中心,也就是0。为什么峰度不是0而是3?
Answers:
峰态当然不是高峰所在的位置。如您所说,这已经称为模式。
峰度是标准化的第四矩:如果是我们要查看的变量的标准化版本,则峰度是该标准化变量的平均四次方;。样本峰度相应地与一组标准化的样本值的平均四次方相关(在某些情况下,其缩放比例在大样本中为1)。 È(Ž4)
如您所述,在正常随机变量的情况下,第四标准矩为3。正如Alecos在评论中指出的那样,有些人将峰度定义为;有时被称为过度峰度(也是第四累积量)。当看到“峰度”一词时,您需要记住这种可能性,即不同的人使用同一个词来指代两个不同(但密切相关)的数量。
峰度通常被描述为峰度*(例如,峰的弯曲程度非常大-大概是为了选择“峰度”一词)或重尾(通常人们对使用峰度进行测量感兴趣)实际上,通常的第四标准时刻并不能完全衡量这两个方面。
确实,肯德尔(Kendall)和斯图尔特(Stuart)的第一卷提供了反例,表明较高的峰度不一定与较高的峰(在标准变量中)或较肥大的尾巴相关(以类似的方式,第三时刻并不能完全衡量多少人认为确实如此)。
但是,在许多情况下,两者都有某种趋势,当峰度较高时,往往会出现更大的峰度和沉重的拖尾现象-我们应该提防,这是必然的情况。
峰度和偏度密切相关(峰度必须至少比偏度的平方大1;当分布几乎对称时,对峰度的解释会更容易。
Darlington(1970)和Moors(1986)表明,峰度的第四矩量度实际上是“肩膀”的变化-,Balanda和MacGillivray(1988)建议以与这种感觉(并考虑其他衡量方法)。如果分布非常集中在,则峰度很小(必要),而如果分布从散开 (这往往会同时将其堆积在中心和将其移到尾巴以将其移离肩膀的可能性),第四时刻峰度会很大。μ ± σ μ ± σ
De Carlo(1997)是阅读峰度的一个合理的起点(在Wikipedia等更基本的资源之后)。
编辑:我偶尔会遇到一些疑问,即较高的峰度(值接近0)是否会完全影响峰度。答案是肯定的。出现这种情况是因为它是标准化变量的第四阶矩-要增加标准化变量的第四阶矩,必须在保持不变的同时增加。这意味着概率进一步移动到尾部必须伴随着进一步的(inside); 反之亦然-如果在将方差保持为1的同时将更多的权重放在中心,则还会在尾部放一些权重。ë (Ž 2)(- 1 ,1 )
[注:如注解所述,作为一般性陈述,这是不正确的;这里需要一个不同的声明。]
被保持方差这种效应常数直接连接到峭度的如在达林顿和停泊的论文“关于肩部变异”的讨论。这个结果不是一波半波的想法,而是一个简单的数学等价-如果不误解峰度,就不能认为它是相反的。
现在可以在不提升峰值的情况下提高内的概率。同样,有可能增加之外的概率,而不必使远处的尾巴变重(例如,通过某些典型的尾巴指数)。也就是说,在使尾巴变轻的同时提高峰度是很有可能的(例如,在均值的任一侧均具有超过2sds的较轻尾巴)。(- 1 ,1 )
[我将Kendall和Stuart包括在参考文献中是因为他们对峰度的讨论也与此有关。]
那么我们能说什么呢?峰度通常与较高的峰和较重的尾巴相关,而不必枯萎。当然,通过打尾巴来提升峰度会更容易(因为可能会超过1 sd),然后调整中心以使方差保持恒定,但这并不意味着该峰没有影响。它确实可以做到,而人们可以通过专注于峰度来操纵峰度。峰度很大程度上但不仅与尾巴沉重有关-再次,注意肩膀结果的变化;如果是峰态正在研究的东西,那是不可避免的数学意义。
参考文献
Balanda,KP和MacGillivray,HL(1988),
“黑体病:关键评论”。
美国统计学家 42,111-119。
达林顿,理查德·B(Richard B.)(1970年),
《峰变真的是“峰顶”吗?
美国统计学家 24,19-22。
Moors,JJA(1986年),
“峰度的含义:重新检查达林顿”。
美国统计学家 40,283-284。
DeCarlo,LT(1997),
“峰度的含义和使用”。
Psychol。方法2,292-307。
肯德尔(MG)和阿·斯图尔特(A. Stuart),
《高级统计理论》,
第1卷。1,第三版
(最近的版本有Stuart和Ord)
这是直接的可视化效果,以了解数字3与正态分布的峰度有关。
令为正态分布,令。令。考虑 pdf的图,。该曲线在零的右边,并延伸至无穷大,其分位数为0.999,为117.2,但是大部分质量接近零;例如,比1.0小68%。
这种分布的平均值是峰度。理解均值的一种常见方法是将pdf图称为“平衡点”。如果正常,则此曲线 平衡为3.0。
该表示法也解释了峰度为何可以测量分布尾部的沉重度。如果是非正态的,则当峰度大于3.0时,曲线 “右移”,因此在这种情况下,的密度可以说“比正态分布更重”。 ” 类似地,当峰度小于3.0时,曲线 “落在左侧”,因此在这种情况下,的密度可以说“比正态分布更轻尾”。
通常认为,较高的峰度是指靠近中心的质量更大(即pdf靠近0的质量 )。尽管在很多情况下是这样,但显然,不是峰值质量(可能会增加)接近零,导致峰度高的情况下图形“向右下降”。相反,它是尾巴杠杆。
从这个角度出发,对峰度的基本正确的“尾巴重量”解释可以更具体地描述为“尾巴杠杆”,以避免将“尾巴重量增加”与“尾巴质量增加”混淆。毕竟,较高的峰度可能对应于尾巴中较小的质量,但是在这种情况下,减小的质量占据了更远的位置。
“给我站立的地方,我将移动地球。” -阿基米德人