背景:我正在向工作中的同事进行假设检验的介绍,并且对它的大部分内容都了解得很好,但是有一个方面是我将自己束之高阁,试图理解并向他人解释。
这就是我想知道的(如果错误,请更正!)
- 如果方差已知,则统计量将是正常的;如果方差未知,则遵循分布
- CLT(中心极限定理):样本平均值的采样分布对于足够大的大约是(对于高度偏斜的分布,可能是,最大可能是)
- 该 -配送可以认为是正常的自由度
如果满足以下条件,则使用 -test:
- 已知总体正态和方差(对于任何样本量)
- 总体正常,方差未知且(由于CLT)
- 人口二项式,,
如果满足以下条件,则使用检验:
- 总体正常,方差未知,
- 不了解总体或方差且,但样本数据看起来正常/通过测试等,因此可以认为总体正常
所以我剩下:
- 对于样本和(?),不知道有关总体和方差的已知/未知信息。
所以我的问题是:
当抽样分布看起来非正态时,您可以假设在什么样本量下(对总体分布或方差一无所知)均值的抽样分布是正态的(即CLT已经加入)?我知道有些发行版需要,但是有些资源似乎说每当时就使用 -test 。
对于我不确定的情况,我想我看一下数据是否正常。现在,如果样本数据看起来正常,我是否应该使用 -test(因为假设总体正常,并且因为)?
我不确定的案例样本数据在哪里看起来不正常呢?在任何情况下,您仍然会使用检验或检验,还是总是希望转换/使用非参数检验?我知道,由于CLT,在的某个值处,均值的采样分布将近似于正态,但是样本数据不会告诉我值是多少。样本数据可能是非正态的,而样本均值遵循正态/。在某些情况下,您会进行转换/使用非参数检验,而实际上均值的采样分布是正态/但您无法分辨吗?