是否有多样本版本或Kolmogorov-Smirnov检验的替代品?


12

我正在比较六对样地中树木的大小分布,其中一个样地接受了处理,另一个样地接受了控制。在每对图上使用Kolmogorov-Smirnov检验,我发现范围为至。是否有适当的方法来处理所有重复样本,例如KS测试的多样本扩展,还是有适当的跟进测试?还是我应该得出这样的结论:“ 在两对图中,大小分布差异显着),而在一对图中则略有差异()”。0.0003707 0.75 p < 0.05 p = 0.59p0.00037070.75(p<0.05p=0.59


2
您想比较这些分布,中心趋势不同或形状不同吗?我倾向于认为KS与分布的形状/性质有关,但是类似Friedman检验的方法可以确定样本的集中趋势有所不同。
gung-恢复莫妮卡

Answers:


13

实际上,有一些KS测试样本。例如,使用的r样本Kolmogorov-Smirnov-Test,我相信它具有良好的功效。这张漂亮的纸的预印本在这里。我也知道Kolmogorov-Smirnov和Cramer-VK样本类似物。Mises测试(据我所知,它们的功能较少)。r2


5
好吧,Böhm和Hornik的“美丽”论文的缺点是,据我所知,没有公开可用的实现。数学非常复杂,您不想自己实现它。我邮寄了作者并询问他们,但他们没有答复。注意Hornik是R Core Developers组的成员...如果有人知道实现,请在此处发布链接!
Laryx Decidua 2015年

8

R包kSamples可为您提供非参数k样本Anderson-Darling检验。零假设是所有k个样本都来自同一分布,无需指定。也许您可以使用此功能。

关于比较按比例缩放正态样本和伽玛分布样本以使其均值和方差相同的小例子:

library("kSamples")
set.seed(142)
samp.num <- 100
alpha <- 2.0; theta <- 3.0  # Gamma parameters shape and scale, using Wikipedia notation
gam.mean <- alpha * theta # mean of the Gamma
gam.sd <- sqrt(alpha) * theta # S.D. of the Gamma
norm.data <- rnorm(samp.num, mean=gam.mean, sd=gam.sd)  # Normal with the same mean and SD as the Gamma
gamma.data <- rgamma(samp.num, shape=alpha, scale=theta)
norm.data2 <- rnorm(samp.num, mean=gam.mean, sd=gam.sd)
norm.data3 <- rnorm(samp.num, mean=gam.mean, sd=gam.sd)
ad.same <- ad.test(norm.data,norm.data2,norm.data3) # "not significant, p ~ 0.459"
ad.diff <- ad.test(gamma.data,norm.data2,norm.data3) # "significant, p ~ 0.00066"

4

几种方法:

使用成对的p值,但可以使用Bon Feroni或False Discovery Rate调整量(第一次可能会有点保守)来调整它们以进行多次比较。然后,您可以确信任何仍然存在显着差异的可能都不是由于多重测试。

您可以通过找到任何分布之间的最大距离来创建具有KS风格的整体测试,即绘制所有经验cdf并找到从最底线到最顶线的最大距离,或者平均距离或其他一些有意义的距离测量。然后,您可以通过进行置换测试来发现这是否有意义:将所有数据分组到一个大仓中,然后将其随机分成与原始组相同的样本大小的分组,重新计算置换数据的统计信息并重复该过程很多次(999左右)。然后查看原始数据与排列后的数据集的比较。如果原始数据统计信息位于排列的统计数据的中间,则不会发现明显的差异,但是如果它位于边缘,或超出任何排列的范围,那么就会发生重大变化(但这并不能告诉您哪些不同)。您可能应该使用模拟数据进行试验,您知道其中存在一个足以引起人们关注的差异,只是为了检查该测试的能力以发现有趣的差异。

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.