我在此留下一段评论,以便使之有意义:原始种群中正态性的假设可能过于局限,可以放弃集中于采样分布,而得益于中心极限定理,尤其是对于大样本。
如果您(通常是这样)不知道总体方差,而是使用样本方差作为估计量,则应用检验可能是一个好主意。需要注意的是相同的方差的假设可能需要用方差F检验或应用合并方差之前Lavene测试进行测试-我在GitHub上的一些注意事项这里。Ť
正如您所提到的,随着样本的增加,t分布确实会收敛于正态分布,如下面的快速R图所示:
红色为正态分布的pdf,紫色为分布的pdf的“胖尾”(或更重的尾巴)随着自由度的增加而逐渐变化,直到最终与正常情节。Ť
因此,对大样本应用z检验可能会很好。
用我的最初答案解决问题。谢谢Glen_b对OP的帮助(解释中可能出现的新错误完全是我的)。
- 在正常假设下的T统计量:
除了一样本与两样本(成对和非成对)的公式中的复杂性之外,关注样本平均值与总体平均值比较的一般t统计量为:
t检验= X¯- μsñ√= X¯- μσ/ n√s2σ2---√= X¯- μσ/ n--√∑ñx = 1(X- X¯)2n − 1σ2--------√(1)
如果遵循均值和方差正态分布:μ σ 2Xμσ2
- 的分子。〜Ñ (1 ,0 )(1 ) 〜ñ(1 ,0 )
- 分母将是(缩放卡方)时,由于作为衍生这里。小号2 / σ 2(1 )s2/ σ2n − 1〜1n − 1χ2n − 1(n − 1 )s2/ σ2〜χ2n − 1
- 分子和分母应独立。
在这些条件下,。t-统计〜吨(dF= n − 1 )
- 中心极限定理:
随着样本量的增加,样本均值的样本分布趋于正态的趋势可以证明假设分子的正态分布是合理的,即使总体不是正态。但是,它不会影响其他两个条件(分母的卡方分布和分子与分母的独立性)。
但并非所有的损失,在这个帖子是讨论Slutzky定理是如何支持对正态分布的渐进收敛,即使不满足分母的阴气分布。
- 坚固性:
在Sawilowsky SS和Blair RC于Psychological Bulletin,1992,Vol.1上发表的论文“更真实地看t检验偏离人口正态性的t检验的鲁棒性和II型误差特性”上。111,第2号,第352-360页,他们针对功率和I型错误测试了较不理想或较“真实世界”(较不正常)的分布,可以找到以下断言:“尽管对类型而言是保守的,对于某些实际分布,t检验是错误的,对于所研究的各种治疗条件和样本量,功率水平几乎没有影响。研究人员可以通过选择稍大的样本量来轻松补偿功率的轻微损失。”。
“ 普遍的观点似乎是,只要涉及(a)类样本错误,只要(a)样本大小相等或近似,(b)样本,独立样本t检验对于非高斯总体形状具有相当强的鲁棒性。样本量相当大(Boneau,1960年,提到的样本量为25至30),并且(c)测试是两尾而不是单尾,同时请注意,当满足这些条件并且标称阿尔法值与实际阿尔法值之间存在差异时,通常,差异通常是保守的,而不是自由的。 ”
作者的确强调了该主题的争议性方面,我期待着哈雷尔教授提到的基于对数正态分布的一些模拟工作。我还想提出一些与非参数方法(例如,Mann-Whitney U检验)进行的蒙特卡洛比较。这项工作正在进行中...
模拟:
免责声明:以下是其中一种以另一种方式“证明自己”的练习。结果不能用于概括(至少不是我本人),但是我想我可以说,这两种(可能有缺陷的)MC模拟对于在这种情况下使用t检验似乎并不太令人沮丧描述。
类型I错误:
关于类型I错误的问题,我使用对数正态分布进行了蒙特卡洛模拟。从参数和的对数正态分布中多次提取被认为是较大样本()的样本,我计算了如果我们比较均值将产生的t值和p值这些样本中,所有样本均来自同一种群,且大小相同。根据注释和右边分布的明显偏斜来选择对数正态:n = 50μ = 0σ= 1
设置显着性水平为的I型实际错误率应该是,还不错。5 %4.5 %
实际上,所获得的t检验的密度图似乎与t分布的实际pdf重叠:
最有趣的部分是看t检验的“分母”,该部分应该遵循卡方分布:
(n − 1 )s2/ σ2= 98( 49(标清2一种+ SD2一种))/ 98(eσ2− 1 )Ë2 μ + σ2
。
在这里,我们使用常见的标准偏差,如本维基百科条目所示:
小号X1个X2= (n1个− 1 )小号2X1个+ (n2− 1 )小号2X2ñ1个+ n2− 2----------------------√
而且,出乎意料的是(或没有),该图与叠加的卡方pdf非常不同:
II型错误和功率:
血压的分布可能是对数正态的,这对于建立一个综合方案非常有用,在该方案中,比较组的平均值在一定程度上与临床相关性分开,例如在一项测试血压影响的临床研究中如果药物集中在舒张压上,则可以认为平均效果下降了 mmHg(选择的SD约为 mmHg):9109
在与这些虚拟组之间的I型错误类似的Monte Carlo模拟上运行比较t检验,并且显着性水平为我们最终得到 II型错误,只有。0.024 %99 %5%0.024%99 %
代码在这里。