分布的峰度与密度函数的几何关系如何?


12

峰度用于测量分布的峰度和平坦度。分布的密度函数(如果存在)可以视为曲线,并具有与其形状相关的几何特征(例如曲率,凸度等)。

因此,我想知道分布的峰度是否与密度函数的某些几何特征有关,从而可以解释峰度的几何含义?


我要在公式中与密度曲线的某些几何量建立某种关系,而不仅仅是我在帖子中指出的含糊含义。或者只是对峰度为何具有几何意义进行一些解释就可以了
Tim

@Peter事实并非如此。几乎可以任意修改PDF图形的几何形状,而无需更改任何指定的(有限数量)矩。
ub

stats.stackexchange.com/questions/25010/…中密切相关的问题表明,对这个问题的正确答案应该是什么。
whuber

@whuber,虽然我同意并感谢您的示例,但我也想知道,与一般的峰度相比,它是否没有更多地说明该特定pdf系列的显着特性。
user603 2014年

@ user603真是令人惊讶。但是,该声明与该特定系列无关:只是发生了对数正态分布,它可以在相同的时刻产生一类替代PDF的显式表示。这特别是所有的时刻是相同的,但在某种程度上扰乱大多数发行,修复自己的时刻有限数量并不难。(对于某些离散的发行版(例如Bernoulli)很难,但它们没有PDF。)
whuber

Answers:


17

连续分布的时刻以及它们的功能(例如峰度)几乎不告诉您其密度函数的图。

例如,考虑以下图形。

在此处输入图片说明

这些每个都是非负函数的图,其积分为:它们都是PDF。而且,它们都具有完全相同的时刻-它们的后无限个时刻。因此,它们共享一个共同的峰度(恰好等于3 + 3 e 2 + 2 e 3 + e 4)13+3e2+2e3+e4

这些函数的公式是

fk,s(x)=12πxexp(12(log(x))2)(1+ssin(2kπlog(x))

- 1 小号1 ķ žx>0, 1s1,kZ.

该图在左侧显示的值,在顶部显示k的值。左列显示了标准对数正态分布的PDF。sk

肯德尔的《高级统计学理论》(Stuart&Ord,第5版)中的练习6.21 要求读者证明它们都具有相同的时刻。

可以类似地修改任何 pdf,以创建形状完全不同但具有相同的第二和第四中心矩(比如说)的另一个pdf,因此,它们具有相同的峰度。仅从该示例可以清楚地看出,峰度不是曲线的对称性,单峰性,双峰性,凸性或任何其他熟悉的几何特征的易于解释或直观的度量。

因此,弯矩的功能(以及峰度是一种特殊情况)不能描述pdf图的几何特性。这在直觉上是有道理的:因为pdf通过面积表示概率,所以我们几乎可以自由地将概率密度从一个位置移动到另一个位置,从而从根本上改变pdf的外观,同时固定任意数量的预先指定的矩。


1
“仅从这个例子就应该很清楚……曲线的任何其他熟悉的几何特征。” 我理解您的意思,但此处的解释存在合理分歧的基础。达林顿的另一种解释是,他展示了如何从对称分布开始,在特定点移动一些质量来增加/减少峰度(再次,与您的示例不矛盾,只是更“积极”的理解)。
user603 2014年

1
@ user603我不同意,但我认为“正”方法忽略了隐式做出的非常特殊的假设,以使其完全起作用。也可以从一个极不对称的PDF图表开始,其偏度为零(不难构建)。因此,这种积极的方法仅描述了质量移动时某些非常特殊的PDF会发生什么情况。尽管这对于直觉很有用,但似乎与当前问题没有逻辑联系。
whuber

1
我同意偏斜(以及您的一般回答)。但是,峰度作为函数具有最小限度。这使事情变得更加有趣。
user603 2014年

1
@ user603谢谢;这是有见地的区别。我认为它不会以任何重要的方式改变目前的任何结论,但是它确实有助于直觉,并指出了偶数和奇数时刻之间的重要区别。
ub

6

对于对称分布(即那些均匀的中心矩有意义的分布),峰度测量基础pdf的几何特征。峰度与分布的峰值有关(或通常与之相关)是不正确的。相反,峰度衡量的是基础分布距离对称 双峰分布有多远(代数,完全对称和双峰分布的峰度为1,这是峰度可具有的最小可能值)[0]。

简而言之,如果您定义:

k=E(xμ)4/σ4

E(X)=μ,V(X)=σ2

k=V(Z2)+11

Z=(Xμ)/σ

kZ2

[0] RB Darlington(1970)。峰病真的是“尖峰病”吗?美国统计员卷。24,第2号。

[1] JJA Moors(1986)。峰顶的意义:重新审视达林顿。美国统计学家,第40卷,第4期。


1
您到处都写“双峰”的意思是“单峰”吗?
whuber

1
fμg(x)=(f(x)+f(2μx))/2.g1。因此,至少,峰度对双峰性无能为力。既然没有,那么它确切描述了pdf的什么几何特性?
whuber


1
峰度不表示双峰态,除非在极端情况下接近双峰态,这表示类似于两点等概率分布。您可以具有峰度的所有可能值的双峰分布。有关示例,请参阅ncbi.nlm.nih.gov/pmc/articles/PMC4321753
彼得·韦斯特伦

1
ppv0

5

[注意:这是针对现场的另一个问题而写的;答案合并到当前问题中。这就是为什么此答案似乎回答了措辞不同的问题。但是,大多数帖子在这里都应具有相关性。]

峰度不能真正衡量分布的形状。在某些分销家族中,您可以说它描述了形状,但更普遍的是峰度并不能告诉您有关实际形状的太多信息。形状受许多因素影响,包括与峰度无关的因素。

如果使用图片搜索峰度,则会显示很多这样的图片:

p

相反,它似乎显示出变化的方差,而不是增加峰度。为了进行比较,这是我刚刚绘制的三个法线密度(使用R),具有不同的标准偏差:

在此处输入图片说明

如您所见,它看起来与上一张图片几乎相同。这些都具有完全相同的峰度。相比之下,这是一个可能更接近该图的目标的示例

在此处输入图片说明

绿色曲线既更尖峰,也更重尾(尽管此显示不适合查看尾部实际重了多少)。蓝色曲线的峰值较少,尾巴非常轻(实际上,除它根本没有尾巴)6

人们谈论峰度时通常指的是密度的形状。但是,峰度可能很细微-不必那样工作。

例如,在给定的方差下,较高的峰度实际上可以以较低的峰出现。

人们还必须提防零多余峰度暗示正常现象的诱惑(在很多书中都公开指出)。存在峰度过大0的分布,这与正常情况完全不同。这是一个例子:

dgam 2.3

确实,这也说明了前面的观点。我可以很容易地构造出一个峰度比正常分布更高的相似分布,但其中心仍为零-完全没有峰值。

网站上有许多帖子进一步描述了峰度。这里是一个例子。


但是我没有说吗?书上说了吗?
Stat Tistician 2015年

我知道。我从没说过你说的 您如何建议我回应您所问的公然错误的陈述?只是假装他们没看错?
Glen_b-恢复莫妮卡

1
@Glen_b这些图片并非来自本书。这本书没有给出插图。我使用goolge图片搜索来查找这些插图。
Stat Tistician 2015年

2
一些作者将峰度表示为峰度,而有些人将其称为尾巴重量,但关于峰度是峰度测量值的怀疑性解释是唯一完全安全的故事。仅由欧文·卡普兰斯基(Irving Kaplansky,1945)给出的数值示例就足以表明,峰度没有明确地解释。(卡普兰斯基的论文是他在1940年代中期撰写的几本关于概率和统计的论文之一。他是一位知名的代数学家,因此而广为人知。)完整的参考资料以及更多内容都在stata-journal.com/sjpdf.html?articlenum=st0204中
尼克·考克斯

1
有一些书籍和论文声称峰度是峰值,因此我的第一句话仍然是正确的,并且可以作为对文献内容的陈述来支持。更关键的是人们如何看待卡普兰斯基的例子和论点。
尼克·考克斯

3

μ±σ

编辑11/23/2018:自从写这篇文章以来,我对峰度提出了一些几何观点。一个是,确实可以根据与正常分位数-分位数图的尾部中预期的45度线的偏差,以几何方式可视化过量峰度;请参阅 此QQ图是否表明瘦小体或扁平小体分布?

pV(v)V={(Xμ)/σ}4XE(V)VX

μ±σXμ±σμσX0.25μ±σμσ


3
您是否会在这里总结这些论点,而不仅是继续在大多数文章中继续让人们参考论文?请参阅帮助这里下“总是提供连结语境”,特别是当它说:“总是给重要组成部分”。在论点广泛的地方并不一定要从字面上引用它,但是至少需要对论点进行总结。您只需要发表一些详尽的声明,然后链接到论文即可。峰度测量尾巴行为的陈述(在没有上下文的情况下)具有误导性(明显如此)
Glen_b -Reinstate Monica

2
...但是,您不可能不同意您在这里没有提出的论点,甚至可能得出更细微的结论。
Glen_b-还原莫妮卡

我的论点清楚地列在这里:en.wikipedia.org/wiki/… 欢迎评论!顺便说一句,峰度衡量尾巴重量的方法,只是与已经考虑的其他方法不同。它通过E(Z ^ 4)来衡量尾巴重量,E(Z ^ 4)是尾巴重量的度量,因为值| Z | <1对其贡献很小。按照相同的逻辑,对于较高的偶数幂n,E(Z ^ n)也是尾部权重度量。
Peter Westfall

嗨,彼得,您好,请访问stats.stackexchange.com/help/merging-accounts合并您的帐户,以便您可以修改旧帖子。
ub

3

一种不同的答案:我们可以使用http://www.quantdec.com/envstats/notes/class_06/properties.htm中的想法,以几何方式说明峰度:图形矩。

k=E(Xμσ)4=(xμσ)4f(x)dx
fXμ,σ2x ke=k3

在下面的内容中,我将显示一些对称分布的峰度图,它们全部以零为中心并缩放为方差1。

视觉峰度的一些对称分布

请注意,从中心实际上没有对峰度做出任何贡献,这表明峰度与“峰值”没有太大关系。


1
Z2b+bb
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.