相信哪个:Kolmogorov-Smirnov测试或QQ情节?


16

我试图确定我的连续数据数据集是否遵循参数shape 1.7和rate 0.000063 的伽马分布。==

问题是,当我使用R来创建数据集对于理论分布伽玛(1.7,0.000063)的QQ图时,我得到了一个图,该图表明经验数据与伽玛分布大致相符。ECDF图也会发生相同的情况。x

但是,当我运行Kolmogorov-Smirnov检验时,它给了我< 1 的不合理的值。p<1个

我应该选择相信哪个?图形输出还是KS测试的结果?

QQplot和ECDF图


您还可以提供所获得的密度分布图吗?
从零开始2014年

13
测试和诊断图并不一致。QQ图显示该分布与理论分布类似。样本量足够大,您可能会发现与理论值相比甚至很小的差异。
Glen_b-恢复莫妮卡2014年

Answers:


18

我不认为“不相信” QQ情节(如果您正确制作了它)没有任何意义。它只是数据真实性的图形表示,与定义性分布并列。显然,这并不是一个完美的匹配,但是如果它足以满足您的目的,那么故事结局或多或少。您可能需要检查以下相关问题:正常性测试是否“基本上没有用”?

KS检验的值基本上是在告诉您,样本量足够大,可以提供强有力的证据来反对零假设,即您的数据与参考分布属于同一分布(我假设您参考的是伽马分布;可能要仔细检查您是否做了)。从QQ图表来看,这似乎也足够清楚(即,存在一些小的但看似系统的偏差模式),因此我认为这里没有真正矛盾的信息。p

对于您的预期目的,您的数据是否与伽玛分布太不同了,这是另一个问题。单靠KS测试无法为您解答(因为其结果取决于您的样本量以及其他原因),但是QQ图可能会帮助您做出决定。您可能还希望寻找计划运行的任何其他分析的可靠替代品,并且如果您特别认真考虑任何后续分析对伽玛分布偏差的敏感性,那么您可能还需要考虑进行一些模拟测试。


15

您可以做的是根据您的理论分布创建多个样本,然后将其绘制在QQ图的背景上。这将使您了解仅通过采样就可以合理预期的可变性。

您可以使用第86-89页的示例扩展该思想,以围绕理论界线创建一个信封:

Venables,WN和Ripley,BD,2002年。S. New York的现代应用统计:Springer。

这将是一个逐点信封。您可以使用第151-154页中的构想,进一步扩展该构想以创建整体信封:

Davison,AC和Hinkley,DV1997。自举方法及其应用。剑桥:剑桥大学出版社。

但是,对于基础探索,我认为仅在QQ图的背景中绘制几个参考样本就足够了。


好主意!提醒我在11个小时内对此表示赞成(用完了我对卡通片的所有票)...我特别喜欢引导ECDF作为丰富这种情节的一种方式。
Nick Stauner 2014年

1
还可以看一下CRAN软件包sfsmisc,它具有ecdf.ksCI函数,可在ecdf图上绘制置信带。可以使用相同的想法在QQ情节上绘制置信带...
kjetil b halvorsen 2015年

2

KS测试假设您的分配的特定参数。它测试假设“数据根据此特定分布进行分布”。您可能在某处指定了这些参数。如果不是,则可能使用了一些不匹配的默认值。注意,如果将估计参数插入假设中,则KS检验将变得保守。

但是,大多数拟合优度测试的使用方法都是错误的。如果KS检验没有显着意义,则并不意味着您要证明的模型是合适的。这就是@Nick Stauner所说的样本量太小。此问题类似于点假设检验和等效检验。

所以最后:只考虑QQ图。


-1

QQ绘图是一种探索性的数据分析技术,应将其当作其他所有EDA绘图一样对待。它们只是为了使您初步了解现有数据。您永远不应基于QQ图等EDA图来决定或停止分析。仅考虑QQ图是错误的建议。您绝对应该使用KS Test等定量技术。假设您还有另一个类似数据集的QQ图,那么在没有定量工具的情况下如何比较两者?在进行EDA和KS测试之后,下一步是为您找出KS测试为何给出低p值的情况(在您的情况下,甚至可能是由于某些错误)。

EDA技术不能用作决策工具。实际上,我想说的是推论统计也只是探索性的。它们为您指示应该进行统计分析的方向。例如,对样本进行t检验只会使您确信该样本可能(或可能不属于)总体的置信度,您仍然可以根据对数据属于什么分布以及什么分布的洞察力进一步进行研究。是其参数等。实际上,当有人指出,甚至作为机器学习库的一部分实现的技术在本质上也是探索性的!!!我希望他们在这个意义上是真的...!

基于图或可视化技术得出统计决策的结论是对统计科学进展的嘲弄。如果您问我,您应该将这些图用作基于定量统计分析传达最终结论的工具。


这使我无法做一些我经常做的事情,并且认为是明智的,在进行探索性图谋时做出决定,并在进行更正式的意义检验之前停止。没有嘲笑是必要的。这是一条重复和教条的评论,对现有的出色且细微得多的答案没有任何帮助。比较QQ情节非常容易...
Nick Cox

我没有阅读其他答案,但是如果他们也鼓励采用定量方法,那很好。对于提出的问题,我已经给出了答案。但是,我很好奇,使用R之类的可用软件包进行正式的定量测试(花几分钟时间来进行KS测试)并不需要花费很多时间,那么为什么有人会在EDA图上停下来?刚通过引导程序验证了R的KS测试结果后,我注意到在一些地方提到它不推荐使用等。..是否由于对传统统计方法的普遍怀疑?这是我发表强烈评论的理由。..不要冒犯任何人
Murugesan Narayanaswamy

您确实应该在发布之前阅读其他答案。发布的含义是您有不同的说法(也是可辩护的)。您的评论令人迷惑,它暗示QQ图不是“定量方法”。QQ图原则上显示了与评估分布拟合有关的所有定量信息。相比之下,像Kolmogorov-Smirnov这样的测试只能提供一维缩减,而对于下一步该怎么做几乎没有帮助。
尼克·考克斯

QQ图将理论分布与给定的测试数据进行比较,并提供直观的表示形式,但是KS测试使用统计概念以更为严格的方式执行相同的操作,并最终给出概率值。您无法比较两个QQ图,但使用KS检验时会得到定量差异。KS检验p值错误是错误的说法。经验数据集不能用于提取分布参数也是错误的。我亲自完成了引导程序,并使用两个表的p值和手动计算的kolomogrov分布进行了验证。
Murugesan Narayanaswamy

您的评论中有很多阴影框,谁在争论您不能在何处使用经验数据来获取参数估计值?这就是我们都应该同意的事情。您必须原谅我不想进行讨论。我支持您的回答。
尼克·考克斯
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.