当数据不是正态分布时,如何测试两组均值之间的差异?


19

我将消除所有生物学上的细节和实验,只引用眼前的问题以及我在统计学上所做的事情。我想知道它是否正确,如果不正确,如何进行。如果数据(或我的解释)不够清楚,我将尝试通过编辑来更好地解释。

假设我有两个组/观测值X和Y,大小分别为N y = 40。我想知道这两个观察的平均值是否相等。我的第一个问题是:Nx=215Ny=40

  1. 如果满足假设,在这里使用参数两样本t检验是否有意义?我问这是因为据我了解,通常在尺寸较小时使用它吗?

  2. 我绘制了X和Y的直方图,并且它们不是正态分布的,这是两次样本t检验的假设之一。我的困惑是,我认为它们是两个人口,这就是为什么我检查正态分布。但是接下来我要进行两次样本t检验... 是吗?

  3. 根据中心极限定理,我了解到如果您多次执行抽样(根据人口规模是否进行重复)并每次计算样本平均值,那么样本将近似呈正态分布。并且,此随机变量的均值将很好地估计总体均值。因此,我决定在X和Y上执行此操作1000次,并获得样本,然后为每个样本的平均值分配一个随机变量。情节是非常正态分布的。X和Y的平均值分别为4.2和15.8(与总体+-0.15相同),方差分别为0.95和12.11。
    我对这两个观测值(每个有1000个数据点)进行了t检验,它们具有不相等的方差,因为它们有很大差异(0.95和12.11)。零假设被拒绝了。
    这有道理吗?这种正确/有意义的方法还是两个样本的z检验足够了还是完全错误的?

  4. 为了确保(在原始X和Y上)我也执行了非参数Wilcoxon检验,并且在那里也令人信服地拒绝了原假设。如果我以前的方法完全错误,我认为进行非参数检验是好的,除了统计功效之外?

在两种情况下,均值均存在显着差异。但是,我想知道这两种方法中的一种还是两种都是错误的/完全错误的,如果是,那有什么替代方法?

Answers:


21

t检验仅适用于小样本的想法已成为历史。是的,它最初是为小样本开发的,但是理论上没有什么可以区分小样本和大样本。在计算机普遍用于统计的日子里,t表通常只能达到大约30个自由度,而法线表则被用来作为t分布的近似值。这是为了保持t表的大小合理。现在,借助计算机,我们可以对任何样本大小进行t检验(尽管对于非常大的样本,z检验和t检验的结果之间的差异很小)。主要思想是在使用样本估计标准偏差时使用t检验,在总体标准偏差已知(非常罕见)的情况下使用z检验。

中心极限定理使我们可以使用正态理论推论(在这种情况下为t检验),即使样本量足够大,总体也不呈正态分布。这确实意味着您的测试是近似的(但对于您的样本量,应具有很好的适应性)。

Wilcoxon检验不是对均值的检验(除非您知道总体完全对称且其他不太可能的假设成立)。如果均值是主要关注点,则t检验可能是引用更好的方法。

鉴于您的标准偏差非常不同,并且形状是非正态的并且可能彼此不同,因此,均值的差异可能不是这里最有趣的事情。考虑科学以及您想如何处理结果。是在人口级别还是在个人级别做出决定?想想这个例子:您正在比较两种特定疾病的药物,其中一种药物的一半立即死亡,另一半在大约一周内恢复;药物B的所有药物都能存活并恢复,但恢复时间超过一周。在这种情况下,您是否真的会担心恢复时间较短?或用非常长的时间(比B组中的任何人都更长)来恢复A中的半死。


谢谢格雷格。我认为程序本身没有问题吗?我知道我可能没有问正确的问题,但我的关注点同样在于统计测试/过程以及对两个样本的理解。我将检查我是否提出正确的问题,然后再提出问题(如果有)。也许如果我解释生物学问题,将有助于您提出更多建议。再次感谢。
阿伦(Arun)

5

Greg已经非常全面的答案中的一个补充。

如果我以正确的方式理解您,则您的观点3指出以下步骤:

  • nX
  • mn
  • 重复这个1000次,保存相应的方法
  • X

现在您的假设是,对于此,中央极限定理成立,并且相应的随机变量将呈正态分布。

也许让我们看一下计算背后的数学以识别错误:

X X1,,XnX1,,XnXmk

Yk=1mi=1mXμik

μikni

11000k=110001mi=1mXμik

Xi1000m1000mXi

但是,现在,中心极限定理指出许多独立随机变量的总和近似为正态。(这也导致均值接近正常值)。

您上面的总和不会产生独立的样本。您可能具有随机权重,但这根本无法使样本独立。因此,以3编写的程序不合法。

t


谢谢。似乎t-test已经使用CLT解决了问题(从我忽略的greg答复中)。感谢您指出这一点,并感谢3)的明确解释,这是我真正想知道的。我将不得不花更多的时间来理解这些概念。
阿伦(Arun)

2
请记住,根据手边的分布,CLT的性能会有所不同(或者更糟的是,不存在期望值或分布的方差-那么CLT甚至无效)。如有疑问,最好生成一个看上去与您观察到的分布相似的分布,然后使用该分布模拟数百次,以进行测试。您将对CLT近似耗材的质量有所了解。
Thilo
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.