我可以使用Kolmogorov-Smirnov来比较两个经验分布吗?


16

是否可以使用Kolmogorov-Smirnov拟合优度检验来比较两个经验分布以确定它们是否似乎来自相同的基础分布,而不是将一个经验分布与预先指定的参考分布进行比较?

让我尝试以另一种方式询问。我从一个位置的某个分布收集了N个样本。我在另一个位置收集了M个样本。数据是连续的(例如,每个样本都是0到10之间的实数),但不是正态分布的。我想测试这些N + M样本是否全部来自相同的基础分布。为此目的使用Kolmogorov-Smirnov检验是否合理?

特别是,我可以从N个样本中计算出经验分布F0,从M个样本中计算出经验分布F 1。然后,我可以计算Kolmogorov-Smirnov检验统计量以测量F 0F 1之间的距离:即,计算D = sup x | F 0x F 1x | ,并使用DNF1MF0F1D=supx|F0(x)F1(x)|D作为我在Kolmogorov-Smirnov检验中拟合优度的检验统计量。这是合理的方法吗?

(我在其他地方读到,关于拟合优度的Kolmogorov-Smirnov检验不适用于离散分布,但我承认我不明白这是什么意思,或者为什么它是正确的。这是否意味着我提出的方法是一种不好的方法? )

或者,您是否推荐其他东西呢?


我想知道是否基于@Glen_b在这里的评论(stats.stackexchange.com/questions/362/…),是否不应该使用KS检验来比较经验分布,因为在估计参数时不应该使用KS检验(? )。
russellpierce 2014年

Answers:


19

没关系,而且很合理。这称为二样本Kolmogorov-Smirnov检验。通过supnorm来测量两个分布函数之间的差异总是明智的,但是要进行正式检验,您需要在两个样本是独立的且每个样本都来自相同基础分布的假设下知道分布。要依靠通常的渐近理论,您将需要基础公共分布(而不是经验分布)的连续性。有关更多详细信息,请参见上面链接的Wikipedia页面。

在R中,您可以使用ks.test,为小样本量计算精确的值。 p


8
在R中,您还可以执行自举KS测试sekhon.berkeley.edu/matching/ks.boot.html,该测试摆脱了连续性要求
G博士

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.