Answers:
没有任何测试可以告诉您残差是正态分布的。实际上,您可以确信它们不是。
假设检验通常不是检查您的假设的好主意。非正态性对您的推断的影响通常不是样本大小*的函数,但是显着性检验的结果是。即使对实际兴趣的问题(“这在多大程度上影响了我的推论?”)的回答可能是“几乎没有”的,但在较大的样本量下,与正常值的微小偏差仍将是显而易见的。相应地,在较小样本量下与正常值的较大偏差可能不会达到显着性。
*(在编辑中添加)-实际上,这太弱了。实际上,只要CLT和Slutsky定理成立,非正态性的影响实际上就随样本量的减少而减小,而拒绝正态性(并可能避免遵循正则理论的程序)的能力随样本量的增加而增加……您最有能力确定非正常性往往是无论如何都没关系 ...而在小样本中,当它实际上很重要时,测试无济于事。
,至少在重要程度上。功率仍然是一个问题,但是,如果我们在这里考虑大样本,那么问题也就不那么严重了。
更接近于测量效果大小的是某种诊断(显示或统计),以某种方式测量非正常程度。QQ图是一个明显的显示,来自同一总体的同一样本量和不同样本量的QQ图至少是同一条曲线的两个嘈杂估计-显示出大致相同的“非正态性”。它至少应该与所关心问题的期望答案单调相关。
如果您必须使用测试,Shapiro-Wilk可能和其他任何东西一样好(Chen-Shapiro测试通常在共同感兴趣的替代方案上要好一些,但很难找到实现)–但这是在回答您的问题已经知道答案了;每当您拒绝拒绝时,它都会给出答案,您可以肯定是错误的。
Shapiro-Wilk测试是一种可能性。
几乎所有统计软件包均实施了此测试。零假设是残差是正态分布的,因此较小的p值表示您应该拒绝零值并得出残差不是正态分布的结论。
请注意,如果样本量很大,您几乎总是会拒绝,因此残差的可视化更为重要。
从维基百科:
单变量正态性检验包括D'Agostino的K平方检验,Jarque–Bera检验,Anderson–Darling检验,Cramér–von Mises准则,Lilliefors检验正态性(本身是Kolmogorov–Smirnov检验的改编), Shapiro-Wilk检验,Pearson卡方检验和Shapiro-Francia检验。《统计建模与分析杂志》 [1]在2011年发表的一篇论文得出的结论是,在给定的意义上,夏皮罗-威尔克(Shapiro-Wilk)具有最好的能力,在比较夏皮罗-威尔克,Kolmogorov-Smirnov,Lilliefors和Anderson-亲爱的测试。