峰度用于测量分布的峰度和平坦度。分布的密度函数(如果存在)可以视为曲线,并具有与其形状相关的几何特征(例如曲率,凸度等)。
因此,我想知道分布的峰度是否与密度函数的某些几何特征有关,从而可以解释峰度的几何含义?
峰度用于测量分布的峰度和平坦度。分布的密度函数(如果存在)可以视为曲线,并具有与其形状相关的几何特征(例如曲率,凸度等)。
因此,我想知道分布的峰度是否与密度函数的某些几何特征有关,从而可以解释峰度的几何含义?
Answers:
连续分布的时刻以及它们的功能(例如峰度)几乎不告诉您其密度函数的图。
例如,考虑以下图形。
这些每个都是非负函数的图,其积分为:它们都是PDF。而且,它们都具有完全相同的时刻-它们的后无限个时刻。因此,它们共享一个共同的峰度(恰好等于− 3 + 3 e 2 + 2 e 3 + e 4)。
这些函数的公式是
为- 1 ≤ 小号≤ 1 ,和ķ ∈ ž。
该图在左侧显示的值,在顶部显示k的值。左列显示了标准对数正态分布的PDF。
肯德尔的《高级统计学理论》(Stuart&Ord,第5版)中的练习6.21 要求读者证明它们都具有相同的时刻。
可以类似地修改任何 pdf,以创建形状完全不同但具有相同的第二和第四中心矩(比如说)的另一个pdf,因此,它们具有相同的峰度。仅从该示例可以清楚地看出,峰度不是曲线的对称性,单峰性,双峰性,凸性或任何其他熟悉的几何特征的易于解释或直观的度量。
因此,弯矩的功能(以及峰度是一种特殊情况)不能描述pdf图的几何特性。这在直觉上是有道理的:因为pdf通过面积表示概率,所以我们几乎可以自由地将概率密度从一个位置移动到另一个位置,从而从根本上改变pdf的外观,同时固定任意数量的预先指定的矩。
对于对称分布(即那些均匀的中心矩有意义的分布),峰度测量基础pdf的几何特征。峰度与分布的峰值有关(或通常与之相关)是不正确的。相反,峰度衡量的是基础分布距离对称和 双峰分布有多远(代数,完全对称和双峰分布的峰度为1,这是峰度可具有的最小可能值)[0]。
简而言之,如果您定义:
[0] RB Darlington(1970)。峰病真的是“尖峰病”吗?美国统计员卷。24,第2号。
[1] JJA Moors(1986)。峰顶的意义:重新审视达林顿。美国统计学家,第40卷,第4期。
[注意:这是针对现场的另一个问题而写的;答案合并到当前问题中。这就是为什么此答案似乎回答了措辞不同的问题。但是,大多数帖子在这里都应具有相关性。]
峰度不能真正衡量分布的形状。在某些分销家族中,您可以说它描述了形状,但更普遍的是峰度并不能告诉您有关实际形状的太多信息。形状受许多因素影响,包括与峰度无关的因素。
如果使用图片搜索峰度,则会显示很多这样的图片:
相反,它似乎显示出变化的方差,而不是增加峰度。为了进行比较,这是我刚刚绘制的三个法线密度(使用R),具有不同的标准偏差:
如您所见,它看起来与上一张图片几乎相同。这些都具有完全相同的峰度。相比之下,这是一个可能更接近该图的目标的示例
绿色曲线既更尖峰,也更重尾(尽管此显示不适合查看尾部实际重了多少)。蓝色曲线的峰值较少,尾巴非常轻(实际上,除它根本没有尾巴)
人们谈论峰度时通常指的是密度的形状。但是,峰度可能很细微-不必那样工作。
例如,在给定的方差下,较高的峰度实际上可以以较低的峰出现。
人们还必须提防零多余峰度暗示正常现象的诱惑(在很多书中都公开指出)。存在峰度过大0的分布,这与正常情况完全不同。这是一个例子:
确实,这也说明了前面的观点。我可以很容易地构造出一个峰度比正常分布更高的相似分布,但其中心仍为零-完全没有峰值。
网站上有许多帖子进一步描述了峰度。这里是一个例子。
编辑11/23/2018:自从写这篇文章以来,我对峰度提出了一些几何观点。一个是,确实可以根据与正常分位数-分位数图的尾部中预期的45度线的偏差,以几何方式可视化过量峰度;请参阅 此QQ图是否表明瘦小体或扁平小体分布?
一种不同的答案:我们可以使用http://www.quantdec.com/envstats/notes/class_06/properties.htm中的想法,以几何方式说明峰度:图形矩。
在下面的内容中,我将显示一些对称分布的峰度图,它们全部以零为中心并缩放为方差1。
请注意,从中心实际上没有对峰度做出任何贡献,这表明峰度与“峰值”没有太大关系。