我是否应该在ezANOVA中包含一个参数以请求III型平方和?


16

我为R开发了ez软件包,以帮助人们从SPSS之类的统计软件包过渡到R。(希望)通过简化各种ANOVA的规格并提供类似于SPSS的输出(包括效果大小和假设)来实现测试),以及其他功能。该ezANOVA()函数主要用作的包装car::Anova(),但是当前版本的ezANOVA()实现仅实现II型平方和,而car::Anova()允许指定II型或-III平方和。正如我可能期望的那样,一些用户要求我在ezANOVA()允许用户请求II型或III型。我一直不愿这样做,并在下面概述了我的推理,但是我希望社区对我或与该问题有关的其他推理提供意见。

原因包括在“SS_type”的说法ezANOVA()

  1. I,II和III型和平方之间的差异仅在数据不平衡时才会出现,在这种情况下,我想说,通过进一步收集数据来改善不平衡比使用ANOVA计算可带来更多的收益。
  2. II型和III型之间的差异适用于由高阶效应限定的低阶效应,在这种情况下,我认为低阶效应在科学上没有意义。(但请参阅下文了解参数的可能复杂之处)
  3. 对于那些不适用(1)和(2)的罕见情况(当无法进行进一步的数据收集并且研究人员对我目前无法想象的合格主效应具有有效的科学兴趣时),可以相对轻松地进行修改的ezANOVA()源或采用car::Anova()本身就实现III型试验。通过这种方式,我将获得III型测试所需的额外工作/理解视为确保只有那些真正了解自己在做什么的人才能走这条路。

现在,最新的III类请求者指出,考虑到以下情况会破坏论点(2),在这种情况下,存在但不重要的高阶效应可能会使平方和的计算偏向于低阶效应。在这种情况下,可以想象的是,研究人员将寻求更高阶的效果,而发现它是“不重要的”,而转向尝试解释对研究人员而言并不为人所折衷的较低阶效果。我最初的反应是,这不是平方和的问题,而是p值和原假设检验的传统。我怀疑,更明确的证据度量(例如,似然比)可能更可能产生与数据一致的支持模型的模棱两可图像。但是,我还没有


2
很快-是的。仅仅是为了与其他软件包保持一致(即使结果在某种程度上“错误”,在这种情况下,警告消息也可以)。并感谢您提供的惊人套餐!
Tal Galili

当我写“程序包”时,我指的是其他统计程序包(例如SPSS和SAS)-我很高兴其他人把观点带回家了,然后我做到了:)
Tal Galili

2
众所周知,当前的ez软件包(版本3)已更新了ezANOVA,该软件包具有SS类型和返回aov模型的参数。
jiggysoo 2011年

Answers:


9

只是为了放大-我相信,我是最近的请求者。

在对Mike观点的具体评论中:

  1. 显然,I / II / III的差异仅适用于相关的预测变量(不平衡设计是最常见的示例,当然在阶乘方差分析中也是如此),但是在我看来,这是一个驳斥对不平衡情况进行分析的论点(以及任何类型I / II / III的辩论)。它可能是不完美的,但这是事情发生的方式(尽管有很多警告,但在许多情况下,进一步收集数据的成本要超过统计问题)。

  2. 这是完全公平的,代表了我所遇到的大多数“ II与III,赞成II”论点的实质。我遇到的最好的总结是Langsrud(2003)“针对不平衡数据的ANOVA:使用Type II而不是Type III的平方和”,《统计与计算》 13:163-167(如果很难找到原始文档,则可以使用PDF, )。他认为(以两因素案例为基础),如果存在相互作用,则存在相互作用,因此,对主效应的考虑通常是没有意义的(显然是公平的);如果没有相互作用,则II型分析主要效果要比Type III强大(毫无疑问),因此您应该始终选择Type II。我看过其他论点(例如Venables,

  3. 我同意这一观点:如果您有互动但对主要效果也有疑问,那么您很可能会自己动手做。

显然,有些人只因为SPSS才需要III型,或者其他一些引用统计上级机构。如果要归结为很多人坚持使用SPSS(我有一些反对意见,例如时间,金钱和许可到期条件)和III型SS,或者很多其他选择,我并不完全反对这种观点。人们转向R和III型SS。但是,从统计角度来看,这一论点显然是me脚的。

但是,我发现更赞成III型的论点是Myers&Well(2003年,“研究设计和统计分析”,第323、626-629页)和Maxwell&Delaney(2004年,“设计实验和分析数据:“模型比较的观点”,第324-328页,第332-335页)。如下所示:

  • 如果存在交互作用,则所有方法的交互作用平方和的结果相同
  • 第二类假设其主要效果的测试没有相互作用。III型不是
  • 某些人(例如Langsrud)认为,如果交互作用不显着,那么您有理由假设没有相互作用,并研究(更强大的)II型主效应
  • 但是,如果对交互作用的测试动力不足,但仍存在交互作用,则该交互作用可能“不显着”出现,但仍会违反II型主效应测试的假设,从而使这些测试偏向于过于宽松。
  • Myers&Well引用Appelbaum / Cramer作为II型方法的主要支持者,然后继续进行[p323]:“ ...对于交互作用的不重要,可以使用更为保守的标准,例如要求交互作用在一般说来,除非有很强的先验理由假定没有相互作用的影响,并且相互作用明显不显着,否则通常不应该计算II型平方和。平方和。” 他们引用[p629],总体而言,Lee&Hornick 1981证明了没有达到显着性的相互作用会偏重主要作用的检验。Maxwell&Delaney [p334]提倡如果人口互动为零,则第二种方法是权力,如果不是,则使用III型方法[用于从这种方法派生出来的方法的可解释性上]。他们也提倡在现实生活中使用III型(当您从数据中推断出是否存在交互作用时),这是因为在交互作用测试中出现2型[动力不足]错误,从而意外违反了II型SS方法的假设;然后,他们对迈尔斯与威尔(Myers&Well)提出了类似的进一步观点,并注意到关于这一问题的长期辩论!重新从数据中推断出是否存在交互作用),这是因为在交互作用测试中出现了2类[动力不足]错误,从而偶然违反了II类SS方法的假设的问题;然后,他们对迈尔斯与威尔(Myers&Well)提出了类似的进一步观点,并注意到关于这一问题的长期辩论!重新从数据中推断出是否存在交互作用),这是因为在交互作用测试中出现了2类[动力不足]错误,从而偶然违反了II类SS方法的假设的问题;然后,他们对迈尔斯与威尔(Myers&Well)提出了类似的进一步观点,并注意到关于这一问题的长期辩论!

因此,我的解释(而且我不是专家!)是,论证的两面都有大量的高级统计局;提出的通常的论点不是关于会引起问题的通常情况(该情况是用非重要相互作用解释主要影响的常见情况);而且在这种情况下,有充分的理由担心第二类方法(归结为权力与潜在的过度自由主义之争)。

对我来说,这足以让ezANOVA中的Type III选项以及Type II都想要,因为(以我的金钱而言)它是R的ANOVA系统的绝佳接口。在我看来,R是从新手易于使用的某种方式开始,并且具有ezANOVA和相当可爱的效果绘制功能的“ ez”程序包对于使R对于更广泛的研究受众来说是很长的路要走。在http://www.psychol.cam.ac.uk/statistics/R/anova.html上,我有一些正在进行中的想法(以及对ezANOVA的讨厌的破解)。

有兴趣听听大家的想法!


嗯,我还没有意识到,只要关联了预测变量,就不会出现II / III类型的区别,其中不平衡的设计只是一个例子。这无疑会进一步破坏我的第一个“只是收集更多数据”的论点。
Mike Lawrence

2
我很相信您的观点,即使为R提供了实现熟悉的分析的简便方法,即使这些分析需要比通常应用更多的细微考虑,R也会获得更多SPSS转换。然后,一旦我们将它们挂接到R上,就可以尝试说服他们熟悉的方法不一定总是合适的方法。我认为我仍将默认值设置为type = 2,并在文档中带有一个大警告,该默认值可能会产生与SPSS不同的结果,并且链接会针对II / III类型区分文档。
Mike Lawrence

相关预测变量的其他变化通常带有连续预测变量,但是是的,这是普遍问题。//对我来说听起来很棒!有时这些转变很慢;我认为使用球度校正(而不是忽略问题)是神经科学方面取得的进步。有时,任何提及(特别是如果您报告了更正的非整数df)都使裁判员认为您在吠叫。
鲁道夫·红衣主教,

我想补充一点,类型III的论点都是关于保守或自由假设检验,而不是关于组成部分的含义。Type III中的主要效果并不明智,因为它包括缺少主要效果的交互。不管保守测试还是自由测试问题,基本模型一致性都需要II型,因为II型主效应是有意义的。也就是说,出于其他原因,ezANOVA应该具有III型。
约翰

7

警告:纯粹非统计性的答案。在进行相同类型的分析(例如ANOVA)时,我更喜欢使用一个函数(或至少一个程序包)。到现在为止,我一直使用它,Anova()因为我更喜欢使用它的语法来指定具有重复度量的模型-与相比aov(),使用非重复度量几乎没有损失(SS类型I)。ezANOVA()对于效果大小的附加好处很好。但是我特别不喜欢的是必须处理3个不同的函数才能进行基本上相同类型的分析,只是因为其中一个实现了特征X(但没有实现Y),而另一个实现了特征(而不是X)。

对于ANOVA,我可以选择oneway()lm()aov()Anova()ezANOVA(),和可能其他人。在讲授R时,要解释不同的选项,它们之间的关系(aov()是的包装器lm())以及哪个函数可以完成的工作已经很痛苦了:

  • oneway()仅适用于单因素设计,但可以选择var.equal=FALSE。没有其他选择aov(),但是这些功能也适用于多要素设计。
  • 重复测量的语法在中有点复杂aov(),在Anova()
  • 方便的SS类型I仅在中aov(),不在Anova()
  • 便利的II型和III型SS仅在Anova()aov()
  • 方便的效果大小度量ezANOVA(),而不是其他

只需讲授一种功能即可完成所有工作的一种功能,那就太好了。如果没有便捷的III型SS,ezANOVA()对我来说就无法实现该功能,因为我知道某些时候会要求学生使用它们(“只是交叉检查John Doe使用SPSS获得的这些结果”)。我觉得最好可以自己做出选择,而不必学习用于指定模型的另一种语法。“我知道最适合您”的态度可能有其优点,但可能会过分保护自己。


1
再增加一个要求:如果该函数也能够运行此ANOVA的各种对比,那将是非常棒的,例如,使用multcomp包(据我所知,它需要aov对象)。否则,我完全同意并通常ez用于我的日常工作,因为它是如此简单……
Henrik

1
添加“方法”参数(可能的值为“ oneway”,“ aov”和“ Anova”,并使用“ ...”参数将var.eq = FALSE传递给oneway并将type = 2传递给Anova)是这是一个有趣的想法,当然,合并起来似乎很容易。谢谢你的建议。
Mike Lawrence

@Henrik:老实说,我对对比的理解非常有限,而且我从未在研究中使用它们,因此我没有优先考虑将对比纳入ez。
Mike Lawrence

@Mike如果您可以添加方法参数,那么您的函数将能够返回一个aov很棒的元素。到目前为止,我通常都懒于制作自己的aov元素,ezANOVA而是将其与t.tests一起使用...
Henrik

@Mike我不敢建议这样的事情,因为这是您要投入的工作。谢谢!该ez软件包具有很大的潜力:在心理学上,它已经被经常推荐(参见Luhmann的德语书籍“ RfürEinsteiger”)。使其更加灵活肯定会受到赞赏。
caracal


0

对我来说,这是关于II / III型问题的大开眼界的辩论。感谢大家在讨论中所做的努力。我会一直坚持认为要相对于III型持续推广II型,但是对这一论点的把握却很弱-我只是依靠John Fox的回归书(汽车)中的建议,即很少建议进行III型测试可以解释(嗯,我想他是说...)。

无论如何,ezANOVA对于允许访问R功能是非常有用的,否则对于我所教授的心理学的本科生来说是不可能的。我提供在线R模块,其中一个具有ezANOVA的功能,以演示混合ANOVA设计(尽管3版之前的版本可能对此不方便... doh!)

在这里尝试:

http://www.wessa.net/rwasp_Mixed%20Model%20ANOVA.wasp

在模块加载(约10秒)后,找到计算按钮(在页面的下半部分),它将运行ezANOVA和关联的表和图。

伊恩


当您说ez对于混合方差分析设计有问题时,您是否基于我最近发布的3.0版本,其中注意到ezMixed()代码中存在错误?如果是这样,我想您会误解该笔记。ezMixed()与ezANOVA()无关。ezMixed()用于帮助评估混合效果建模上下文中固定效果的影响。
麦克劳伦斯

嗨,迈克-您说得很对-这是您对ezMixed()的注释,我为ezANOVA()阅读并曲解了该注释。
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.