如何测试两个(非正态)分布是否不同?


13

我已经阅读了有关学生t检验的信息,但是当我们可以假设原始分布为正态分布时,它似乎可以工作。就我而言,它们绝对不是。

另外,如果我有13个分布,是否需要进行13^2测试?

这是两个分布的样本。 有13个分布。


@Glen_b数据不是离散的。值的范围从-2到2
马丁贝莱斯

Answers:


19

“取决于”有多种含义。

(一个潜在的问题是,原始数据看起来可能是离散的;应予以澄清。)

  1. 根据样本量,非正态性可能不像t检验那样大。至少对于大样本而言,通常至少具有良好的级别鲁棒性-如果I型错误率与正常值相差不远,则不会受到太大影响。尾巴很重,功率可能更成问题。

  2. 如果您正在寻找分布上的任何差异,那么适合两个样本的拟合优度检验,例如两个样本的Kolmogorov-Smirnov检验可能是合适的(尽管也可以进行其他检验)。

  3. 如果要在位置族中查找位置类型差异,或者在比例尺族中查找比例差异,甚至只是P(X> Y)> P(Y> X)类型关系,Wilcoxon-Mann-Whitney两个样本测试可能是合适的。

  4. 如果您可以为想要敏感的差异类型找到合适的统计信息,则可以考虑进行重采样测试,例如置换测试或引导测试。

另外,如果我有13个分布,是否需要进行13 ^ 2测试?

好吧,

首先,您不需要测试对对(第二个比较是多余的)。B B AAB BA

其次,你不需要测试 VS。AAA

这两件事使成对比较从169减少到78。

第三,集体测试是否存在任何差异,然后,如果第一个空值被拒绝,则在事后成对测试中查看成对差异会更普遍(但不是强制性的)。

例如,代替上面第3项中的Wilcoxon-Mann-Whitney,可以进行Kruskal-Wallis检验,该检验对组之间的位置差异敏感。

Kolmogorov-Smirnov检验也有k个样本版本,并且可能存在或构造了其他两个样本拟合优度中的一些类似的检验。

也有k样本版本的重采样测试和t样本测试(即ANOVA,如果样本量足够大,则可以)。


获得有关我们正在处理的内容以及您最感兴趣的是哪种差异的更多信息真是太好了;否则,请查看某些样本的QQ图。


(+1)就像要补充的是,如果您准备假定总体CDF不交叉,则WMW检验应作为对随机优势的检验。如果他们知道这一点,海事组织的人们就会更希望这样做。
Scortchi-恢复莫妮卡

1
@Scortchi-是的。它也有其他解释。最广泛地说,它是对的检验。另一方面,人们应该意识到它的非传递性。P(X<Y)12
Glen_b-恢复莫妮卡2014年

@Glen_b数据不是离散的。值的范围从-2到2
马丁贝莱斯

哇-重要信息!它们是在该范围内(2.1是不可能的),还是只是值在该范围内?
Glen_b-恢复莫妮卡2014年

它们限制在该范围内。
Martin Velez 2014年

5

是的,我认为您不能做得比对其他发行版进行测试更好。

如果认为您的问题与此有关:2个分布的比较

您建议您使用Kolmogorov-Sminorv检验或Cramér-VonMises检验。它们都是非常经典的充足性测试。

在中Rks.teststats包中的函数实现第一个。第二个可以在的软件包中找到cramer

要了解这两个测试:http : //en.wikipedia.org/wiki/Kolmogorov%E2%80%93Smirnov_test http://en.wikipedia.org/wiki/Cram%C3%A9r%E2%80%93von_Mises_criterion


2

您可以尝试Kruskal–Wallis单向方差分析

“它用于比较两个以上独立或不相关的样本”


Rutherford介绍Anova和Ancova:GLM方法中讨论了ANOVA中的违反常态性9.1.2违反正常性

第一行是“尽管大多数来源都报告了方差分析...对于违反正态性假设是稳健的...”


谢谢!似乎应该在进行成对比较之前运行此测试。
Martin Velez 2014年
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.