Questions tagged «anova»

ANOVA代表AAnalysis Of VAriance,这是一种统计模型和一组用于比较多个组均值的程序。ANOVA模型中的自变量是分类的,但是ANOVA表也可以用于测试连续变量。

2
方差分析中变量的顺序很重要,不是吗?
我是否正确理解,在多元ANOVA中指定变量的顺序会有所不同,但是在进行多元线性回归时顺序并不重要? 因此,假设存在诸如测得的失血量 y和两个分类变量之类的结果 增殖腺切除术的方法 a, 扁桃体切除方法 b。 该模型y~a+b不同于该模型y~b+a(或因此我在R中的实现似乎表明了这一点)。 我是否正确理解这里的术语是方差分析是一种层次模型,因为它在尝试将剩余方差归因于第二因素之前首先将尽可能多的方差归因于第一因素? 在上面的示例中,层次结构是有道理的,因为我总是在进行扁桃体切除术之前先进行腺样体切除术,但是如果一个人有两个没有内在顺序的变量会怎样?

4
实际上,当数据与假设不完全一致时,人们如何处理方差分析?
这不是一个严格的统计问题-我可以阅读所有有关ANOVA假设的教科书-我试图弄清楚实际工作的分析师如何处理不完全符合假设的数据。我在该网站上遇到了很多问题,寻找答案,并且不断寻找有关何时不使用ANOVA(在抽象的,理想化的数学上下文中)或如何完成我在R中描述的某些事情的文章。我实际上是在试图弄清人们实际做出的决定以及原因。 我正在对来自四组树(实际树,而非统计树)中的分组数据进行分析。我已经为每棵树获取了大约35个属性的数据,并且正在研究每个属性以确定这些属性上的组是否存在显着差异。但是,在某些情况下,由于方差不相等,因此违反了ANOVA假设(根据Levene检验,使用alpha = .05)。 正如我所看到的,我的选择是:1.对数据进行功率变换,看看它是否会改变Levene p值。2.使用非参数测试,例如Wilcoxon(如果是,是哪个?)。3.对方差分析结果进行某种校正,例如Bonferroni(我实际上不确定是否存在这样的东西吗?)。我尝试了前两个选项,但结果略有不同-在某些情况下,一种方法很重要,而另一种则没有。我担心会掉入p值钓鱼陷阱,并且正在寻找可以帮助我确定使用哪种方法的建议。 我还读过一些东西,表明除非方差和方差相互关联(即,两者都一起增加),否则异方差对ANOVA来说并不是真正的大问题,因此,除非我看到Levene的结果,否则我可以忽略它这样的模式?如果是这样,是否有测试方法? 最后,我应该补充一点,我正在做此分析,以便在同行评审的期刊上发表,因此,无论我采用哪种方法,都必须通过评审员的评审。因此,如果任何人都可以提供指向相似的已发布示例的链接,那就太好了。

2
针对两个受试者内因素在R中使用lme / lmer进行重复测量ANOVA
我正在尝试lme从nlme软件包中复制aov重复测量方差分析的结果。对于单因素重复测量实验和具有一个受试者间因素和一个受试者内因素的两因素实验,我已经做到了,但是对于在两个因素内的两个因素实验,我却遇到了麻烦主题因素。 一个例子如下所示。A和B是固定效应因子和subject是随机效应的因素。 set.seed(1) d <- data.frame( Y = rnorm(48), subject = factor(rep(1:12, 4)), A = factor(rep(1:2, each=24)), B = factor(rep(rep(1:2, each=12), 2))) summary(aov(Y ~ A*B + Error(subject/(A*B)), data=d)) # Standard repeated measures ANOVA library(nlme) # Attempts: anova(lme(Y ~ A*B, data=d, random = ~ 1 | subject)) # not same as …


2
您如何“控制”一个因素/变量?
据我了解,“控制”在统计中可以有两个含义。 对照组:在实验中,未对对照组成员进行任何治疗。例如:安慰剂与药物:您将药物分配给一组而不是另一组(对照组),这也称为“对照实验”。 变量控制:分离特定自变量影响的技术。赋予该技术的其他一些名称是“占”,“保持常数”,“控制”,一些变量。例如:在一项足球观看研究中(喜欢或不喜欢),您可能想要消除性别的影响,因为我们认为性别会导致偏见,也就是说,男性可能比女性更喜欢它。 所以,我的问题是针对第(2)点。两个问题: 通常,您如何“控制” /“考虑”变量。使用什么技术?(就回归而言,方差分析框架)。 在上面的示例中,随机选择男性和女性是否构成控制?也就是说,“随机性”是控制其他效果的技术之一吗?

3
什么时候需要重复测量方差分析而不是混合效果模型?
为了回答这个问题,关于我的设计(我向参与者随机展示不同类别的图片的设计)是否是一个示例,我应该使用重复测量方差分析,我得到的答案是我应该使用混合模型,其中之一是原因是我有两种形式的依赖关系:主题和类别。 现在我的问题是:在进行这种重复测量设计时,是否总是总是以这种方式有两个依赖关系?也就是说,在什么情况下重复测量方差分析优于混合效果建模方法,为什么?

1
为什么要完全使用ANOVA而不是直接进行事后或计划中的比较测试?
考虑到群体之间的方差分析情况,您首先实际进行这样的ANOVA测试,然后进行事后(Bonferroni,Šidák等)或计划的比较测试,您会得到什么?为什么不完全跳过ANOVA步骤? 我认为在这种情况下,组间ANOVA的一个好处是能够使用Tukey的HSD作为事后测试。后者需要ANOVA表中的组内均方来计算其相关的标准误差。但是,对不成对t检验的Bonferroni和Šidák调整不需要任何方差分析输入。 我想就小组内部方差分析的情况提出同样的问题。我知道在这种情况下,Tukey的HSD测试不是一个相关的考虑因素,这使得这个问题更加紧迫。

1
为什么t检验和ANOVA为两组比较给出不同的p值?
在有关ANOVA的Wikipedia文章中,它说 ANOVA以其最简单的形式提供了几组均值是否相等的统计检验,因此将t检验推广到了两组以上。 我的理解是,在进行两组比较时,方差分析与t检验相同。 但是,在下面的简单示例中(R),ANOVA和t检验给出了相似但略有不同的p值。谁能解释为什么? x1=rnorm(100,mean=0,sd=1) x2=rnorm(100,mean=0.5,sd=1) y1=rnorm(100,mean=0,sd=10) y2=rnorm(100,mean=0.5,sd=10) t.test(x1,x2)$p.value # 0.0002695961 t.test(y1,y2)$p.value # 0.8190363 df1=as.data.frame(rbind(cbind(x=x1,type=1), cbind(x2,type=2))) df2=as.data.frame(rbind(cbind(x=y1,type=1), cbind(y2,type=2))) anova(lm(x~type,df1))$`Pr(>F)`[1] # 0.0002695578 anova(lm(x~type,df2))$`Pr(>F)`[1] # 0.8190279

1
备忘单ANOVA字母汤和回归等效项
我能否获得帮助以完成此暂定(正在进行中)的尝试,以了解与ANOVA和REGRESSION等效项的含义?我一直在尝试调和这两种方法的概念,术语和语法。这个站点上有很多关于它们的共性的帖子,例如this或this,但是在开始时有一张快速的“ you are here”地图仍然是一件好事。 我计划更新此帖子,并希望获得纠正错误的帮助。 单向方差分析: Structure: DV is continuous; IV is ONE FACTOR with different LEVELS. Scenario: miles-per-gal. vs cylinders Note that Income vs Gender (M, F) is a t-test. Syntax: fit <- aov(mpg ~ as.factor(cyl), data = mtcars); summary(fit); TukeyHSD(fit) Regression: fit <- lm(mpg ~ as.factor(cyl), mtcars) # …

1
MANOVA与LDA有何关系?
在几个地方,我看到一种说法,即MANOVA就像ANOVA加上线性判别分析(LDA)一样,但是它总是以挥舞自如的方式进行的。我想知道这到底是什么意思。 我找到了各种各样的教科书,描述了MANOVA计算的所有细节,但是似乎很难找到不是统计学家的人可以进行好的一般讨论(更不用说图片了)。

2
如何获得显着的总体方差分析,但Tukey的过程没有成对的显着差异?
我用R进行了方差分析,并且得到了很大的不同。但是,当使用Tukey的程序检查哪些对有显着差异时,我什么也没得到。这怎么可能? 这是代码: fit5_snow<- lm(Response ~ Stimulus, data=audio_snow) anova(fit5_snow) > anova(fit5_snow) Analysis of Variance Table Response: Response Df Sum Sq Mean Sq F value Pr(>F) Stimulus 5 73.79 14.7578 2.6308 0.02929 * Residuals 84 471.20 5.6095 --- Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1 …

1
Bonferroni还是Tukey?什么时候比较数量变大?
使用SPSS(第三版)阅读Field的发现统计信息我对ANOVA中的事后测试感到有些震惊。对于那些想要控制I型错误率的人,他建议使用Bonferroni或Tukey并说(第374页): 当比较次数较少时,Bonferroni具有更大的功能,而在测试大量均值时,Tukey的功能更为强大。 少量和大量均值之间的界限应该在哪里?

1
我是否正确计算了这些似然比?
我是R 的ez程序包的作者,并且我正在进行一个更新,以在ANOVA的输出中包括自动计算似然比(LR)。这个想法是为每种效应提供一个LR,类似于ANOVA所达到的那种效应的测试。例如,主要效果的LR表示空模型与包含主要效果的模型的比较,交互作用的LR表示包含组件主要效果的模型与同时包含主要效果和他们的互动等等 现在,我对LR计算的理解来自Glover&Dixon(PDF),它涵盖了基本计算以及对复杂性的更正,以及Bortolussi&Dixon的附录(附录PDF),其中涵盖了涉及重复测量变量的计算。为了检验我的理解,我开发了此电子表格,该电子表格从示例ANOVA(使用虚假数据从2 * 2 * 3 * 4设计生成)中提取dfs和SS,并逐步计算每种效果的LR。 如果对这种计算更有信心的人可以看一下并确保我做的一切正确,我将不胜感激。对于那些喜欢抽象代码的人,这是实现对ezANOVA()的更新的R代码(请参见第15-95行)。


1
在设计的实验中,如何在ANOVA和ANCOVA之间进行选择?
我正在进行以下实验: DV:切片消耗(连续或分类) IV:健康消息,不健康消息,无消息(对照)(在其中随机分配了3个组的人员-分类)这是有关切片的健康性的可操纵消息。 以下IV可被视为个体差异变量: 冲动性(可以是分类的,即高与低或连续的,并通过标尺进行测量) 甜味偏爱(这也是通过问卷调查来衡量的,每个问题有3种选择) BMI-将对参与者进行相应的称重(也可以视为绝对或连续)。 由于将各组随机分配到3个组中的一个,因此我假设我正在进行某种ANOVA,并且可能会使用阶乘ANOVA,因为我对哪种IV对DV的影响最大,而且IV之间的相互作用也很感兴趣(如研究所示)某些组合之间存在关系。 但是由于需要知道IV最好是分类的,连续的还是混合的,我对此并不完全确定。 还是ANCOVA是一种可能性甚至是回归,但我不确定,因为将他们分配到了各个小组,然后根据他们对调查的回答进行了分类。 我希望这是有道理的,并希望能收到某人的询问。

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.