Answers:
正如我所说的,对于您对上一个问题的评论,请查看Kolmogorov-Smirnov检验。它使用两个累积分布函数之间的最大绝对距离(也可以认为是QQ绘图中距45度线的曲线的最大绝对距离)作为统计数据。可以使用ks.test()
“状态”库中的命令在R中找到KS测试。这是有关其R用法的更多信息。
我最近使用经验CDF和拟合CDF之间的相关性来量化拟合优度,并且我想知道这种方法在当前情况下是否也有用,据我所知,它涉及比较两个经验数据集。如果集合之间存在不同数量的观测值,则可能需要插值。
我想说,比较两个分布的或多或少的规范方法将是卡方检验。不过,该统计数据尚未标准化,具体取决于您如何选择垃圾箱。最后一点当然可以看作是一个功能,而不是一个错误:例如,正确选择垃圾箱可让您更紧密地寻找尾部的相似性,而不是分布中间的相似性。
可以直接在QQ图中直接测量线性度的“接近度”,即Shapiro-Francia检验统计量(与更知名的Shapiro-Wilk有密切关系,可以视为对其的简单近似)。
Shapiro-Francia统计量是有序数据值和预期正态统计量之间的平方相关性(有时标记为“理论分位数”),也就是说,它应该是您在图中看到的相关性的平方,非常直接简易措施。
(Shapiro-Wilk是相似的,但是考虑了订单统计信息之间的相关性;它与Shapiro-Francia具有相似的解释,并且与QQ图的摘要几乎一样有用。)
无论哪种方式,对于QQ图显示的单个数字摘要,其中一种可能是对图进行汇总的合适方法。