Questions tagged «anova»

ANOVA代表AAnalysis Of VAriance,这是一种统计模型和一组用于比较多个组均值的程序。ANOVA模型中的自变量是分类的,但是ANOVA表也可以用于测试连续变量。

2
如何在R中既没有正态又没有方差相等的数据上进行双向ANOVA?
目前,我正在研究硕士论文,并计划使用SigmaPlot运行统计数据。但是,在花了一些时间处理数据后,我得出的结论是SigmaPlot可能不适合我的问题(我可能会误解了),因此我在R中开始了首次尝试,但并没有因此而变得更加容易。 计划是根据我的数据运行一个简单的TWO-WAY-ANOVA,该结果来自3种不同的蛋白质和对此进行8种不同的处理,所以我的两个因素是蛋白质和处理。我同时使用 > shapiro.test(time) 和 > ks.test(time, "norm", mean=mean(time), sd=sqrt(var(time))) 在这两种情况下(也许并不奇怪),我最终都得到了非正态分布。 哪一个给我留下了第一个问题,即哪个检验用于方差相等。我想出了 > chisq.test(time) 结果是,我的数据也没有方差相等。 我尝试了不同的数据转换(对数,中心,标准化),所有这些都不能解决我的方差问题。 现在我不知所措,如何进行ANOVA来测试哪些蛋白质和哪些治疗方法彼此之间有显着差异。我发现了有关Kruskal-Walis-Test的一些信息,但仅出于一个因素(?)。我还发现了有关排名或randamization的内容,但还没有找到如何在R中实现这些技术的方法。 有人建议我该怎么办吗? 编辑:谢谢您的回答,我对阅读有点不知所措(似乎越来越多而不是更少),但是我当然会继续前进。 根据建议,这是我的数据示例(对于格式,我感到非常抱歉,我无法找到其他解决方案或放置文件的地方。对于这一切我仍然是陌生的。): protein treatment time A con 2329.0 A HY 1072.0 A CL1 4435.0 A CL2 2971.0 A CL1-HY sim 823.5 A CL2-HY sim 491.5 A CL1+HY mix 2510.5 A CL2+HY mix …

4
我是否应该在ezANOVA中包含一个参数以请求III型平方和?
我为R开发了ez软件包,以帮助人们从SPSS之类的统计软件包过渡到R。(希望)通过简化各种ANOVA的规格并提供类似于SPSS的输出(包括效果大小和假设)来实现测试),以及其他功能。该ezANOVA()函数主要用作的包装car::Anova(),但是当前版本的ezANOVA()实现仅实现II型平方和,而car::Anova()允许指定II型或-III平方和。正如我可能期望的那样,一些用户要求我在ezANOVA()允许用户请求II型或III型。我一直不愿这样做,并在下面概述了我的推理,但是我希望社区对我或与该问题有关的其他推理提供意见。 原因不包括在“SS_type”的说法ezANOVA(): I,II和III型和平方之间的差异仅在数据不平衡时才会出现,在这种情况下,我想说,通过进一步收集数据来改善不平衡比使用ANOVA计算可带来更多的收益。 II型和III型之间的差异适用于由高阶效应限定的低阶效应,在这种情况下,我认为低阶效应在科学上没有意义。(但请参阅下文了解参数的可能复杂之处) 对于那些不适用(1)和(2)的罕见情况(当无法进行进一步的数据收集并且研究人员对我目前无法想象的合格主效应具有有效的科学兴趣时),可以相对轻松地进行修改的ezANOVA()源或采用car::Anova()本身就实现III型试验。通过这种方式,我将获得III型测试所需的额外工作/理解视为确保只有那些真正了解自己在做什么的人才能走这条路。 现在,最新的III类请求者指出,考虑到以下情况会破坏论点(2),在这种情况下,存在但不重要的高阶效应可能会使平方和的计算偏向于低阶效应。在这种情况下,可以想象的是,研究人员将寻求更高阶的效果,而发现它是“不重要的”,而转向尝试解释对研究人员而言并不为人所折衷的较低阶效果。我最初的反应是,这不是平方和的问题,而是p值和原假设检验的传统。我怀疑,更明确的证据度量(例如,似然比)可能更可能产生与数据一致的支持模型的模棱两可图像。但是,我还没有

5
检查方差分析假设
几个月前,我在SO上的R中发布了一个有关均方差测试的问题,Ian Fellows回答说(我将他的回答解释得很宽松): 在测试模型拟合优度时,同方差测试不是一个好的工具。对于小样本,您没有足够的能力来检测偏离同方差,而对于大样本,您具有“足够的权力”,因此,您更有可能筛选甚至是琐碎的均等偏离。 他的好回答是我的耳光。每次运行ANOVA时,我都会检查正态性和均方差性假设。 您认为检查ANOVA假设时的最佳做法是什么?

3
R?中的非参数重复测量多方方差分析
以下问题是一段时间以来对我而言最神圣的问题之一,我希望有人能够提供很好的建议。 我希望使用R执行非参数重复测量多方方差分析。 我已经在网上进行了一段时间的搜索和阅读,到目前为止,仅能找到以下几种情况的解决方案:Friedman测试单向非参数重复测量方差分析,有序回归与{car} Anova函数用于多路非参数方差分析等。部分解决方案不是我在此问题线程中寻找的。我在一段时间前发布的一篇文章中总结了到目前为止的发现(标题为:重复测量R的方差分析(函数和教程),以防万一。 如果我在网上阅读的内容是正确的,则可以使用混合序数回归模型(又称比例赔率模型)来完成此任务。 我发现了两个看似相关的软件包,但找不到关于该主题的任何插图: http://cran.r-project.org/web/packages/repolr/ http://cran.r-project.org/web/packages/ordinal/ 因此,对于这个主题来说,我是新手,我希望这里的人们能提供一些指导。 是否有关于该主题的任何教程/建议阅读的内容?甚至更好的是,有人可以建议一个简单的示例代码来说明如何在R中运行和分析此代码(例如:“非参数重复测量多方方差分析”)吗?

1
lmer模型使用哪种多重比较方法:lsmeans或glht?
我正在使用具有一个固定效果(条件)和两个随机效果(由于主题设计和配对而导致的参与者)的混合效果模型分析数据集。该模型是使用lme4包生成的exp.model<-lmer(outcome~condition+(1|participant)+(1|pair),data=exp)。 接下来,我针对没有固定效果(条件)的模型对该模型进行了似然比检验,结果有显着差异。我的数据集中有3个条件,因此我想进行多重比较,但不确定使用哪种方法。我在CrossValidated和其他论坛上发现了许多类似的问题,但我仍然很困惑。 据我所见,人们建议使用 1.该lsmeans包- lsmeans(exp.model,pairwise~condition)这给了我下面的输出: condition lsmean SE df lower.CL upper.CL Condition1 0.6538060 0.03272705 47.98 0.5880030 0.7196089 Condition2 0.7027413 0.03272705 47.98 0.6369384 0.7685443 Condition3 0.7580522 0.03272705 47.98 0.6922493 0.8238552 Confidence level used: 0.95 $contrasts contrast estimate SE df t.ratio p.value Condition1 - Condition2 -0.04893538 0.03813262 62.07 -1.283 0.4099 Condition1 - …

2
重复测量方差分析:正态性假设是什么?
我对重复测量方差分析中的正态性假设感到困惑。具体来说,我想知道究竟应该满足哪种常态。在阅读有关简历的文献和答案时,我遇到了这种假设的三种不同的措词。 每个(重复)条件中的因变量应正常分布。 人们常说rANOVA与ANOVA具有相同的假设,另外还有球形度。这就是Field的发现统计资料以及Wikipedia 关于该主题和Lowry的文章的主张。 残差(所有可能的对之间的差异?)应正态分布。 我发现在多个答案此声明CV(1,2)。通过将rANOVA 与配对t检验进行类比,这似乎也很直观。 应该满足多元正态性。 维基百科和此资源提到了这一点。另外,我知道,朗诺可以换用MANOVA,这可能值得这个要求。 这些等效吗?我知道多元正态性意味着DV的任何线性组合都是正态分布的,因此3.如果我正确理解后者,自然会包括2.。 如果这些都不相同,那么rANOVA的“真实”假设是什么?你能提供参考吗? 在我看来,对第一个主张的支持最大。但是,这与此处通常提供的答案不一致。 线性混合模型 由于@utobi的提示,我现在了解如何将rANOVA重新描述为线性混合模型。具体来说,为了建模血压随时间的变化,我将期望值建模为: 其中y i j是血压的测量值,a i是平均血压第i个对象的压力,而t i j为第i个对象被测量的第j次,b iE[yij]=ai+bitij,E[yij]=ai+bitij, \mathrm{E}\left[y_{ij}\right]=a_{i}+b_i t_{ij}, yijyijy_{ij}aiaia_{i}iiitijtijt_{ij}jjjiiibibib_i表示该变化的血压是跨学科的不同了。两种效果都被认为是随机的,因为受试者的样本只是人群的随机子集,这是最主要的兴趣所在。 最后,我尝试考虑这对正常性意味着什么,但收效甚微。释义McCulloch和Searle(2001,p。35. Eq。(2.14)): E[yij|ai]yij|aiai=ai∼indep. N(ai,σ2)∼i.i.d. N(a,σ2a)E[yij|ai]=aiyij|ai∼indep. N(ai,σ2)ai∼i.i.d. N(a,σa2)\begin{align} \mathrm{E}\left[y_{ij}|a_i\right] &= a_i \\[5pt] y_{ij}|a_i &\sim \mathrm{indep.}\ \mathcal{N}(a_i,\sigma^2) \\[5pt] a_i &\sim \mathrm{i.i.d.}\ \mathcal{N}(a,\sigma_a^2) \end{align} 我明白这意味着 4.每个人的数据都需要正态分布,但这在很少的时间点进行测试是不合理的。 我用第三种表达的意思是 5.各个主题的平均值呈正态分布。请注意,这是上述三种基础之上的另外两种不同的可能性。 McCulloch,CE和Searle,SR(2001)。广义模型,线性模型和混合模型。纽约:John …

1
SAS和R中ANOVA中III型平方和的冲突结果
我从不平衡因子实验都与分析数据SAS和R。双方SAS并R提供平方类似的I型和广场,但他们的III型总和彼此不同。以下是SAS和R代码以及输出。 DATA ASD; INPUT Y T B; DATALINES; 20 1 1 25 1 2 26 1 2 22 1 3 25 1 3 25 1 3 26 2 1 27 2 1 22 2 2 31 2 3 ; PROC GLM DATA=ASD; CLASS T B; MODEL Y=T|B; RUN; SAS的I型SS Source …
15 r  anova  sas  sums-of-squares 

1
如何设置和解释ANOVA与R中的汽车包装的对比?
假设我有一个想要进行ANOVA的简单2x2阶乘实验。像这样: d <- data.frame(a=factor(sample(c('a1','a2'), 100, rep=T)), b=factor(sample(c('b1','b2'), 100, rep=T))); d$y <- as.numeric(d$a)*rnorm(100, mean=.75, sd=1) + as.numeric(d$b)*rnorm(100, mean=1.2, sd=1) + as.numeric(d$a)*as.numeric(d$b)*rnorm(100, mean=.5, sd=1) + rnorm(100); 在没有重大交互作用的情况下,默认情况下(即contr.treatment)的输出Anova()是的a所有级别b和的b所有级别的总体重要性a,对吗? 我应该如何指定一个对比,让我来测试效果的意义a与b在B1水平保持恒定,效果a与b被关押在B2水平不变,并相互作用的a:b?
15 r  anova  contrasts 


3
ANOVA假设(方差相等,残差的正态性)为何重要?
在运行方差分析时,我们被告知必须进行某些测试假设才能使其适用于数据。对于测试起作用的必要条件,我从未理解以下原因: 在设计的每个单元格中,因变量(残差)的方差应相等 对于设计的每个单元,您的因变量(残差)应近似正态分布 我了解关于是否需要满足这些假设存在一些灰色区域,但是出于争论的目的,如果在给定的数据集中完全不满足这些假设,那么使用ANOVA将会带来什么问题?

2
为什么lrtest()与anova(test =“ LRT”)不匹配
我一直在寻找在R中进行似然比测试以比较模型拟合的方法。我首先自己编写了代码,然后在包中找到了默认anova()功能。但是,当我检查时,即使将“ test”参数设置为“ LRT” ,也总是会产生与其他两个略有不同的p值。实际上是在执行一些微妙的不同测试,还是我不了解某些内容?lrtest()lmtestanova()anova() 平台:在Linux Mint 17 lmtest版本0.9-33 上运行的R 3.2.0 样例代码: set.seed(1) # Reproducibility n=1000 y = runif(n, min=-1, max=1) a = factor(sample(1:5, size=n, replace=T)) b = runif(n) # Make y dependent on the other two variables y = y + b * 0.1 + ifelse(a==1, 0.25, 0) mydata = …

3
您将如何在R中进行贝叶斯ANOVA和回归分析?[关闭]
关闭。这个问题是题外话。它当前不接受答案。 想改善这个问题吗? 更新问题,使它成为交叉验证的主题。 2年前关闭。 我有一个相当简单的数据集,由一个自变量,一个因变量和一个分类变量组成。我在运行诸如aov()和的频繁测试方面有丰富的经验lm(),但是我无法弄清楚如何在R中执行它们的贝叶斯等效项。 我想对前两个变量进行贝叶斯线性回归,并使用分类变量作为分组进行方差的贝叶斯分析,但是我找不到任何简单的示例来说明如何使用R做到这一点。都?此外,贝叶斯分析所创建的输出统计信息到底是什么,它们表示什么? 我对统计数据不是很精通,但是共识似乎是,现在认为使用带有p值的基本测试有些误入歧途,我正在努力跟上。问候。

1
如何使用lmer估计具有随机效应的模型的方差成分并将其与lme结果进行比较
我进行了一项实验,从两个不同的来源人群中抚养了不同的家庭。每个家庭被分配两种治疗方法之一。实验结束后,我测量了每个人的几个特征。为了测试治疗或来源的效果以及它们之间的相互作用,我使用了以家庭为随机因素的线性混合效应模型,即 lme(fixed=Trait~Treatment*Source,random=~1|Family,method="ML") 到目前为止,到目前为止,我现在必须计算相对方差分量,即通过处理或源以及交互作用来解释的变化百分比。 没有随机效应,我可以轻松地使用平方和(SS)来计算每个因素所解释的方差。但是对于混合模型(带有ML估计),没有SS,因此我认为我也可以使用Treatment和Source作为随机效应来估计方差,即 lme(fixed=Trait~1,random=~(Treatment*Source)|Family, method="REML") 但是,在某些情况下,lme无法收敛,因此我使用了lme4软件包中的lmer: lmer(Trait~1+(Treatment*Source|Family),data=DATA) 在哪里使用摘要功能从模型中提取方差: model<-lmer(Trait~1+(Treatment*Source|Family),data=regrexpdat) results<-VarCorr(model) variances<-results[,3] 我得到与VarCorr函数相同的值。然后,我使用这些值以总和作为总变化量来计算实际的变化百分比。 我在努力挣扎的是对初始lme模型(以治疗和来源为固定效应)和随机模型以估计方差成分(以治疗和来源为随机效应)的结果的解释。我发现在大多数情况下,由每个因素解释的方差百分比与固定效应的重要性不符。 例如,对于性状HD,最初的lme暗示了相互作用的趋势以及对治疗的重要性。使用后退程序,我发现“治疗”有接近明显的趋势。但是,在估计方差成分时,我发现Source具有最高的方差,占总方差的26.7%。 LME: anova(lme(fixed=HD~as.factor(Treatment)*as.factor(Source),random=~1|as.factor(Family),method="ML",data=test),type="m") numDF denDF F-value p-value (Intercept) 1 426 0.044523 0.8330 as.factor(Treatment) 1 426 5.935189 0.0153 as.factor(Source) 1 11 0.042662 0.8401 as.factor(Treatment):as.factor(Source) 1 426 3.754112 0.0533 和lmer: summary(lmer(HD~1+(as.factor(Treatment)*as.factor(Source)|Family),data=regrexpdat)) Linear mixed model fit by REML Formula: …
14 r  anova  variance  lme4-nlme 

3
从三向方差分析表中删除因子
在最近的一篇论文中,我安装了一个三向固定效果模型。由于其中一个因素并不重要(p> 0.1),因此我将其删除,并使用两个固定的效果和一个相互作用对模型进行了重新拟合。 我刚刚让裁判发表评论,引用一下: 时间不是三方方差分析的重要因素,本身也不是汇集时间因素的充分标准:关于此问题的标准文本(Underwood 1997)认为,非显着影响的p值必须为大于0.25才能合并一个因子的治疗水平。作者应在此处给出相关的p值,并参考Underwood 1997证明其合并的合理性。 我的问题是: 我从未听说过0.25规则。还有其他人吗?我可以理解的是,如果p值接近临界值,则无法删除该因素,但是拥有“规则”似乎有点极端。 这位裁判指出,Underwood 1997是标准文本。真假的啊?我从来没听说过。标准文本是什么(是否存在这样的东西)?不幸的是,我无法访问1997年的Underwood。 对裁判的任何建议。 背景:本文已提交给非统计期刊。当拟合三向模型时,我检查了交互作用。

4
后续行动:在ANOVA图表之间的混合内,估计的SE或实际的SE?
我目前正在整理一篇论文,从昨天开始偶然发现了这个问题,这使我向自己提出了同样的问题。更好地为我的图表提供来自数据的实际标准误差还是由ANOVA估算的误差? 由于昨天的问题相当具体,我的问题相当具体,我认为提出这个后续问题是适当的。 详细信息: 我已经在某个认知心理学领域(条件推理)中进行了一项实验,将两组(归纳和演绎指令,即受试者之间的操作)与两个受试者内部的操作(问题的类型和问题的内容)进行了比较。两个因素水平)。 结果看起来像这样(左侧面板显示的是ANOVA输出的SE值,右侧面板显示的是根据数据估算的SEs): 请注意,不同的行代表两个不同的组(即,对象间操作),而内部在x轴(即2x2因子水平)上绘制受试者操作。 在本文中,我提供了方差分析的相应结果,甚至提供了中间关键交叉交互的计划比较。SE在那里为读者提供了有关数据可变性的一些提示。我更倾向于使用SE,而不是标准偏差和置信区间,因为绘制SD并不常见,并且在比较对象之间和对象之间的CI时存在严重问题(因为肯定适用于SE,错误地推断出显着差异的情况并不常见从他们)。 重复我的问题:绘制从ANOVA估计的SE是更好还是我应该绘制从原始数据估计的SE? 更新: 我认为我应该对SE的估算值更加清楚。SPSS中的ANOVA输出为我estimated marginal means提供了相应的SE和CI。这是在左图中绘制的内容。据我了解,它们应该是残差的标准差。但是,当保存残差时,它们的SD不会以某种方式接近估计的SE。因此,一个次要的(可能是特定于SPSS的问题)将是:这些SE是 什么? 更新2:我终于设法编写了一个R函数,该函数应该能够像我最终喜欢的那样自行绘制(请参见我接受的答案)。如果有人有时间,如果您可以看一下,我将不胜感激。这里是。

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.