检查方差分析假设


16

几个月前,我在SO上的R中发布了一个有关均方差测试的问题,Ian Fellows回答说(我将他的回答解释得很宽松):

在测试模型拟合优度时,同方差测试不是一个好的工具。对于小样本,您没有足够的能力来检测偏离同方差,而对于大样本,您具有“足够的权力”,因此,您更有可能筛选甚至是琐碎的均等偏离。

他的好回答是我的耳光。每次运行ANOVA时,我都会检查正态性和均方差性假设。

您认为检查ANOVA假设时的最佳做法是什么?

Answers:


11

在应用的设置中,更重要的是要知道是否有任何违反假设的问题在推理上都是有问题的。

在大样本中,基于显着性检验的假设检验很少受到关注,因为大多数推论检验对于轻度违反假设的情况都很有力。

假设的图形化评估的一个不错的功能是,它们将注意力集中在违规程度上,而不是对任何违规的统计意义上。

但是,也有可能关注数据的数字摘要,这些摘要量化违反假设的程度,而不是统计显着性(例如,偏度值,峰度值,最大与最小组方差之比等)。您还可以获得这些值的标准误差或置信区间,对于较大的样本,这些误差会减小。这种观点与统计意义不等于实际重要性的一般观点是一致的。


1
+1为涵盖所有内容的绝佳答案。Tabachnik和Fidell的《使用多元统计数据》(适用于SPSS和SAS)中很好而适用地描述了如何应用上述数值过程:amazon.com/Using-Multivariate-Statistics-Barbara-Tabachnick/dp/…(但请参阅随附的网页)
Henrik

好吧,我认为大多数时候像偏度和峰度之类的摘要都没有什么价值,它们的抽样变化也很大。但是,可以考虑用L_skewness和L-峰度替代它们。
kjetil b halvorsen

@kjetilbhalvorsen我想这取决于您通常使用哪种样本大小。以我的经验,曲线图和偏斜度统计数据对于理解数据的分布非常有帮助。
Jeromy Anglim

@杰罗姆·安格利姆(Jeromy Anglim):好的。然后,我猜您通常有很大的样本量!您是否尝试过引导偏度/峰度系数?
kjetil b halvorsen

9

几个图表通常比正常或同方差测试的p值更具启发性。将观察到的因变量与自变量作图。对拟合进行观察。根据自变量绘制残差。研究这些地块上看起来很奇怪的东西。如果某些事情看起来并不奇怪,我将不必担心对假设的重大考验。


多数情况下,这是一个很好的建议,但是对于大型数据集,您无法手动浏览所有数据又会如何呢?
dsimcha 2010年

1
n1n2<ασ2

2
@dsimcha关于大型数据集:取决于您所说的“大型”。有很多观察?使用良好的图形(箱线图,抖动的点状图,向日葵图)。有很多自变量?是的,您在这里有个要点...但是,如果您有太多IV,而您无法针对每个IV绘制DV,那么我将完全使用ANOVA进行提问-看起来在任何情况下都难以解释案件。某些智能机器学习方法可能更好(Brian D. Ripley:“挑衅地说,'机器学习是统计减去对模型和假设的任何检查'。”)
S. Kolassa-恢复莫妮卡2010年

好评论,+ 1。即使这个特定的问题与方差分析有关,但在撰写答复时,我还是在更一般的层面上考虑绘图与测试的问题。
dsimcha 2010年

4

这些是一些非常好的网络指南,可用于检查ANOVA的假设以及失败时应采取的措施。是一个。是另一回事。

本质上,您的眼睛是最好的判断者,因此请进行一些探索性数据分析。这意味着绘制数据-直方图和箱形图是评估正态性和同质性的好方法。并且请记住,方差分析对于轻微违反这些规定的行为是有力的。


4

QQ图是检测非正常性的好方法。

对于同质性,请尝试Levene检验或Brown-Forsythe检验。两者是相似的,尽管BF更加健壮。它们对非正态性的敏感性不如Bartlett的检验,但即使如此,我仍然发现它们在小样本量下不是最可靠的。

QQ剧情

布朗福赛测试

莱文测试


相对分布图(或与正态分布相比)可以很好地替代,因为对于初学者而言,它们的解释可能更清晰。
kjetil b halvorsen

3

我同意其他人的观点,即对假设进行重要性检验是有问题的。

ķķ

半参数(秩)方法(例如Wilcoxon和Kruskal-Wallis检验)的假设要少得多。对于Wilcoxon-Kruskal-Wallis测试,ECDF的对数应该是平行的,以具有最大的功效(对于他们来说,I型错误永远不是问题)。线性不是必需的。等级测试假设不同组的分布如何与其他分布相关,但不假设任何一个分布的形状。


By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.