在检验和检验之间选择


20

背景:我正在向工作中的同事进行假设检验的介绍,并且对它的大部分内容都了解得很好,但是有一个方面是我将自己束之高阁,试图理解并向他人解释。

这就是我想知道的(如果错误,请更正!)

  • 如果方差已知,则统计量将是正常的;如果方差未知,则遵循分布t
  • CLT(中心极限定理):样本平均值的采样分布对于足够大的大约是(对于高度偏斜的分布,可能是,最大可能是)n30300
  • 该 -配送可以认为是正常的自由度t>30

如果满足以下条件,则使用 -test:z

  1. 已知总体正态和方差(对于任何样本量)
  2. 总体正常,方差未知且(由于CLT)n>30
  3. 人口二项式,,np>10nq>10

如果满足以下条件,则使用检验:t

  1. 总体正常,方差未知,n<30
  2. 不了解总体或方差且,但样本数据看起来正常/通过测试等,因此可以认为总体正常n<30

所以我剩下:

  • 对于样本和(?),不知道有关总体和方差的已知/未知信息。>30<≈300

所以我的问题是:

  1. 当抽样分布看起来非正态时,您可以假设在什么样本量下(对总体分布或方差一无所知)均值的抽样分布是正态的(即CLT已经加入)?我知道有些发行版需要,但是有些资源似乎说每当时就使用 -test 。n>300zn>30

  2. 对于我不确定的情况,我想我看一下数据是否正常。现在,如果样本数据看起来正常,我是否应该使用 -test(因为假设总体正常,并且因为)?zn>30

  3. 我不确定的案例样本数据在哪里看起来不正常呢?在任何情况下,您仍然会使用检验或检验,还是总是希望转换/使用非参数检验?我知道,由于CLT,在的某个值处,均值的采样分布将近似于正态,但是样本数据不会告诉我值是多少。样本数据可能是非正态的,而样本均值遵循正态/。在某些情况下,您会进行转换/使用非参数检验,而实际上均值的采样分布是正态/但您无法分辨吗? tznntt


4
对于高度偏斜的发行版,可能高达300个。 ” ...在某些情况下,可能更多。否则可能永远不会发生。选择任意,我将向您展示一个还不够的情况。n
Glen_b-恢复莫妮卡2014年

谢谢Glen_b-所以总是检查样本数据看起来正常以使用参数化吗?
哈蒂2014年

@哈蒂不!当数据看起来不正常时,T检验有效。
2014年

Answers:


24

@AdamO是正确的,如果您不知道总体标准偏差a-priori ,则只需使用t -test 。您不必担心何时切换到z测试,因为t会为您“切换”。更具体地,t -配送收敛到正常,因此它是正确分配到使用在每个N

N=30下,传统线的含义也存在混淆。人们谈论两种融合:

  1. 首先是,尽管从数据中估计了SD ,但从正态分布(组内)原始数据计算出的测试统计量(即t)的采样分布收敛为N的正态分布。(如上所述,t会为您解决这个问题。)
  2. 第二个问题是,当N ∞时非正态分布(组内)原始数据的平均值的采样分布收敛为正态分布(比上述速度更慢)。人们依靠中央极限定理来为他们解决这个问题。但是,我们无法保证它会收敛在任何合理的样本量之内,当然没有理由相信30(或300)是幻数。根据非正态的大小和性质,它可能会花费很长的时间(请参阅@Macro在这里的答案:OLS残差不呈正态分布时的回归N30300)。如果您认为(组内)原始数据不是很正常,则最好使用其他类型的测试,例如Mann-Whitney U - test。请注意,对于非正常数据,Mann-Whitney U检验可能比t检验更强大,即使开始使用CLT也是如此。(也值得指出的是,进行正态检验可能会使您误入歧途,请参阅:正常性测试是否“基本上没有用”?

无论如何,要想更明确地回答您的问题,如果您认为自己(组内)的原始数据不是正态分布的,请使用Mann-Whitney U -test;如果您认为数据是正态分布的,但您不知道SD先验,则使用t检验;如果您认为数据是正态分布的并且知道SD先验,请使用z -test。

它可能会帮助您在这里阅读@GregSnow的最新答案:关于比较这些问题中R中两个小组之间的比例的p值的解释


谢谢,这真的很有帮助,我知道随着n值的t检验接近正常值,我将其复杂化了。因此严格来说,即使SD未知先验,即使n为1000,也应使用t检验?
哈蒂2014年

别客气。严格来说,是的,但是请注意,此时很难分辨分布与正态分布之间的差异。t
gung-恢复莫妮卡

当然是。对不起,我这么挑剔,很难想像如何以黑白方式向他人解释。感谢您的帮助,谢谢!
哈蒂2014年

还要注意的是,计算t检验结果是出于所有目的和目的,而如今却没有有意义的额外计算成本。我们不再在一些不能涵盖所有情况的纸质表格中查找测试统计信息,我们只是在询问计算机。那么,为什么还要担心并担心使用z检验是否还能获得相同的结果呢?
比约恩

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.