Answers:
我不确定我是否正确解释了您的问题,所以请告诉我,我可以调整或删除此答案。首先,我们没有证明有关数据的事情,我们只是证明事情并非不合理。这可以通过几种方法来完成,其中一种是通过统计测试。但是,我认为,如果您有预先指定的理论分布,最好的方法就是制作一个qq-plot。大多数人认为qq-plots仅用于评估正态性,但是您可以针对可指定的任何理论分布绘制经验分位数。如果使用R,则车载套件具有增强功能qq.plot()具有很多不错的功能;我喜欢的两个是,您不仅可以指定高斯分布,还可以指定许多不同的理论分布(例如,您可以t
选择一个更宽广的尾部分布),并绘制95%的置信带。如果您没有特定的理论分布,而只想看看尾部是否比正常情况下的预期重,则可以在qq图上看到它,但有时很难识别。我喜欢的一种可能性是制作一个核密度图以及一个qq图,您可以在其上叠加一个法线曲线以进行引导。基本的R代码是plot(density(data))
。对于一个数字,您可以计算峰度,然后查看它是否高于预期。我不了解R中峰度的固定函数,您必须使用链接页面上给出的方程式对其进行编码,但这并不难。
kurtosis
可以使用这里的功能。
library(moments); apply(matrix(1:5,5,1), 1, function(p) kurtosis((1:100)^p))
:请注意,随着较高功率下右尾部的伸展,峰度如何增加。