Questions tagged «anova»

ANOVA代表AAnalysis Of VAriance,这是一种统计模型和一组用于比较多个组均值的程序。ANOVA模型中的自变量是分类的,但是ANOVA表也可以用于测试连续变量。

2
普通英语中的复合对称是什么?
我最近意识到,将混合模型的相关结构设置为复合对称性时,仅将主体作为随机因素而将其他因素作为固定因素的混合模型等效于ANOVA。 因此,我想知道在混合(即分裂图)方差分析的背景下复合对称是什么意思,充其量只能用简单的英语进行解释。 除了复合对称性以外,lme还提供其他类型的相关结构,例如 corSymm 通用相关矩阵,没有其他结构。 或不同类型的空间相关性。 因此,我有一个相关的问题,关于在设计实验的环境中(对象间和对象内的因素)建议使用其他类型的相关结构? 如果答案能指向一些针对不同相关结构的参考文献,那就太好了。

3
手动计算逻辑回归95%置信区间与在R中使用confint()函数之间为什么会有区别?
亲爱的大家-我注意到我无法解释的怪事,可以吗?总之:在logistic回归模型中计算置信区间的手动方法和R函数confint()得出不同的结果。 我一直在研究Hosmer&Lemeshow的Applied Logistic回归(第二版)。在第3章中,有一个计算比值比和95%置信区间的示例。使用R,我可以轻松地重现模型: Call: glm(formula = dataset$CHD ~ as.factor(dataset$dich.age), family = "binomial") Deviance Residuals: Min 1Q Median 3Q Max -1.734 -0.847 -0.847 0.709 1.549 Coefficients: Estimate Std. Error z value Pr(>|z|) (Intercept) -0.8408 0.2551 -3.296 0.00098 *** as.factor(dataset$dich.age)1 2.0935 0.5285 3.961 7.46e-05 *** --- Signif. codes: 0 ‘***’ 0.001 ‘**’ …
34 r  regression  logistic  confidence-interval  profile-likelihood  correlation  mcmc  error  mixture  measurement  data-augmentation  r  logistic  goodness-of-fit  r  time-series  exponential  descriptive-statistics  average  expected-value  data-visualization  anova  teaching  hypothesis-testing  multivariate-analysis  r  r  mixed-model  clustering  categorical-data  unsupervised-learning  r  logistic  anova  binomial  estimation  variance  expected-value  r  r  anova  mixed-model  multiple-comparisons  repeated-measures  project-management  r  poisson-distribution  control-chart  project-management  regression  residuals  r  distributions  data-visualization  r  unbiased-estimator  kurtosis  expected-value  regression  spss  meta-analysis  r  censoring  regression  classification  data-mining  mixture 

1
在R中使用anova()函数比较两个模型
从文档中anova(): 给定一系列对象后,“ anova”将按照指定的顺序对模型进行测试... 相互测试这些模型意味着什么?为什么顺序很重要? 这是GenABEL教程中的示例: > modelAdd = lm(qt~as.numeric(snp1)) > modelDom = lm(qt~I(as.numeric(snp1)>=2)) > modelRec = lm(qt~I(as.numeric(snp1)>=3)) anova(modelAdd, modelGen, test="Chisq") Analysis of Variance Table Model 1: qt ~ as.numeric(snp1) Model 2: qt ~ snp1 Res.Df RSS Df Sum of Sq Pr(>Chi) 1 2372 2320 2 2371 2320 1 0.0489 0.82 …
32 r  anova 

4
二项式数据的方差分析
我正在分析实验数据集。数据由治疗类型和二项式结果的配对向量组成: Treatment Outcome A 1 B 0 C 0 D 1 A 0 ... 在结果列中,1表示成功,0表示失败。我想弄清楚治疗方法是否会显着改变结果。有4种不同的处理方式,每个实验重复多次(每种处理方式2000次)。 我的问题是,我可以使用ANOVA分析二进制结果吗?还是应该使用卡方检验来检查二项式数据?似乎卡方假设比例将被平均分配,事实并非如此。另一个想法是使用每种治疗成功与失败的比例来汇总数据,然后使用比例检验。 我很想听到您对这些二项式成功/失败实验有意义的测试建议。

1
混合效果模型上的多重比较
我正在尝试使用混合效果模型分析一些数据。我收集的数据代表了一些不同基因型的年轻动物随时间的体重。 我正在使用此处提出的方法:https : //gribblelab.wordpress.com/2009/03/09/repeated-measures-anova-using-r/ 特别是我正在使用解决方案2 所以我有类似 require(nlme) model <- lme(weight ~ time * Genotype, random = ~1|Animal/time, data=weights) av <- anova(model) 现在,我想进行一些比较。使用multcomp我可以做到: require(multcomp) comp.geno <- glht(model, linfct=mcp(Genotype="Tukey")) print(summary(comp.geno)) 而且,当然,我可以随着时间做同样的事情。 我有两个问题: 如何mcp查看时间与基因型之间的相互作用? 我跑步时glht收到以下警告: covariate interactions found -- default contrast might be inappropriate 这是什么意思?我可以放心地忽略它吗?还是应该避免这种情况? 编辑: 我发现此PDF指出: 由于在这种情况下不可能自动确定感兴趣的参数,因此默认情况下,multcomp中的mcp()将仅针对主要效果生成比较,而忽略协变量和交互作用。从版本1.1-2开始,可以指定对交互项进行平均,并分别使用参数interact_average = TRUE和covariate_average = TRUE进行协变量,而早于1.0-0的版本将对交互项进行自动平均。但是,我们建议用户手动编写所需的对比集。每当对默认的对比度量有疑问时,都应该这样做,这通常发生在具有更高阶交互项的模型中。关于这个问题的进一步讨论和例子,我们参考许(1996),第7章,和塞尔(1971),第7.3章。 我没有那些书,但是也许有人在吗?

4
使用复杂数据进行分析,有什么不同?
假设您正在做线性模型,但是数据很复杂。yyy y=xβ+ϵy=xβ+ϵ y = x \beta + \epsilon 我的数据集很复杂,因为中的所有数字均为形式。处理此类数据时,在程序上有什么不同吗?yyy(a+bi)(a+bi)(a + bi) 我问是因为,您最终将获得复杂的协方差矩阵,并测试具有复杂价值的统计数据。 做最小二乘时,是否需要使用共轭转置而不是转置?复数值协方差有意义吗?

1
anova()命令对lmer模型对象有什么作用?
希望这是一个问题,在这里有人可以为我解答,该问题的本质是根据拟合的混合效应模型lmer(来自lme4 R软件包)分解平方和。 首先,我应该说我已经意识到使用这种方法的争议,在实践中,我更有可能使用自举LRT来比较模型(如Faraway,2006年所建议)。但是,我对如何复制结果感到困惑,因此出于我的理智,我想在这里问一下。 基本上,我正在使用lme4包装所适合的混合效果模型。我知道您可以使用该anova()命令来总结按顺序测试模型中的固定效果。据我所知,这就是Faraway(2006)所说的“预期均方”方法。我想知道的是平方和如何计算? 我知道我可以从特定模型中获取估计值(使用coef()),假设它们是固定的,然后使用有和没有感兴趣因素的模型残差平方和进行测试。这对于包含单个主题内因子的模型来说是很好的。但是,在实施分割图设计时,平方和值I get等于R通过aov()适当的Error()名称使用R生成的值。但是,尽管F比率相同,但这与命令在模型对象上产生的平方和并不anova()相同。 当然这是完全有意义的,因为Error()在混合模型中不需要分层。但是,这必须意味着在混合模型中对平方和进行某种程度的惩罚,以提供适当的F比率。如何实现的?模型如何以某种方式校正图间平方和而不校正图内平方和。显然,这是通过为不同效果指定不同的误差值而实现的经典分割图方差分析所必需的,那么混合效果模型如何做到这一点? 基本上,我希望能够自己复制anova()应用于lmer模型对象的命令的结果,以验证结果和我的理解,但是,目前,我可以针对常规的受试者内部设计实现此目标,而对于拆分主体则无法实现。情节设计,我似乎无法找出为什么是这种情况。 举个例子: library(faraway) library(lme4) data(irrigation) anova(lmer(yield ~ irrigation + variety + (1|field), data = irrigation)) Analysis of Variance Table Df Sum Sq Mean Sq F value irrigation 3 1.6605 0.5535 0.3882 variety 1 2.2500 2.2500 1.5782 summary(aov(yield ~ irrigation + variety + Error(field/irrigation), …

3
当成对t检验都不存在时,方差分析是否有意义?
如果没有成对t检验,单向(组或“水平”)ANOVA可能会报告显着差异?ñ> 2ñ>2N>2ñ(N− 1 )/ 2ñ(ñ-1个)/2N(N-1)/2 在这个答案中 @whuber写道: 众所周知,即使在任何一对均值的单独[未调整的成对] t检验都不会产生显着结果的情况下,全局ANOVA F检验也可以检测均值的差异。 因此显然有可能,但我不知道如何。什么时候发生,这种情况背后的直觉是什么?也许有人可以提供这种情况的简单玩具示例? 进一步说明: 显然可能存在相反的情况:总体ANOVA可能不显着,而某些成对的t检验错误地报告了显着差异(即,那些都是假阳性)。 我的问题是关于标准的,未经多次比较t检验的调整。如果使用调整后的测试(例如Tukey的HSD程序),那么即使整体ANOVA仍然没有一个是有意义的。这在几个问题中都涉及到,例如,如何获得显着的总体ANOVA,但与Tukey的过程没有成对的显着差异?和显着的方差分析相互作用,但非显着的成对比较。 更新。我的问题最初是指通常的两样本成对t检验。但是,正如@whuber在评论中指出的那样,在方差分析的背景下,t检验通常被理解为事后对比,它使用对所有组进行汇总的组内方差的ANOVA估计(这不是两个组中发生的事情) -样本t检验)。因此,我的问题实际上有两个不同的版本,对它们的回答都被肯定。见下文。

3
R:尽管数据集中没有NaN,随机森林仍在“外部函数调用”错误中抛出NaN / Inf [关闭]
我正在使用插入符号在数据集上运行交叉验证的随机森林。Y变量是一个因素。我的数据集中没有NaN,Inf或NA。但是,当运行随机森林时,我得到 Error in randomForest.default(m, y, ...) : NA/NaN/Inf in foreign function call (arg 1) In addition: There were 28 warnings (use warnings() to see them) Warning messages: 1: In data.matrix(x) : NAs introduced by coercion 2: In data.matrix(x) : NAs introduced by coercion 3: In data.matrix(x) : NAs introduced by …


1
从lmer模型计算效果的可重复性
我刚刚碰到了这篇论文,该论文描述了如何通过混合效应建模来计算测量的可重复性(又称可靠性,又称类内相关性)。R代码为: #fit the model fit = lmer(dv~(1|unit),data=my_data) #obtain the variance estimates vc = VarCorr(fit) residual_var = attr(vc,'sc')^2 intercept_var = attr(vc$id,'stddev')[1]^2 #compute the unadjusted repeatability R = intercept_var/(intercept_var+residual_var) #compute n0, the repeatability adjustment n = as.data.frame(table(my_data$unit)) k = nrow(n) N = sum(n$Freq) n0 = (N-(sum(n$Freq^2)/N))/(k-1) #compute the adjusted repeatability Rn = …
28 mixed-model  reliability  intraclass-correlation  repeatability  spss  factor-analysis  survey  modeling  cross-validation  error  curve-fitting  mediation  correlation  clustering  sampling  machine-learning  probability  classification  metric  r  project-management  optimization  svm  python  dataset  quality-control  checking  clustering  distributions  anova  factor-analysis  exponential  poisson-distribution  generalized-linear-model  deviance  machine-learning  k-nearest-neighbour  r  hypothesis-testing  t-test  r  variance  levenes-test  bayesian  software  bayesian-network  regression  repeated-measures  least-squares  change-scores  variance  chi-squared  variance  nonlinear-regression  regression-coefficients  multiple-comparisons  p-value  r  statistical-significance  excel  sampling  sample  r  distributions  interpretation  goodness-of-fit  normality-assumption  probability  self-study  distributions  references  theory  time-series  clustering  econometrics  binomial  hypothesis-testing  variance  t-test  paired-comparisons  statistical-significance  ab-test  r  references  hypothesis-testing  t-test  normality-assumption  wilcoxon-mann-whitney  central-limit-theorem  t-test  data-visualization  interactive-visualization  goodness-of-fit 

3
MANOVA和重复测量方差分析之间的区别?
在某些因素(例如实验条件)下重复测量ANOVA与MANOVA有什么区别? 尤其是我偶然发现的一个网站提出,MANOVA不能像重复测量ANOVA那样对球形度做出相同的假设,对吗? 如果是这样,为什么不总是使用MANOVA? 我试图对多个DV进行重复测量方差分析,什么是合适的方法?

7
R中带有对比代码的III型SS ANOVA如何处理?
请提供R代码,该代码允许以-3,-1、1、3的对比度进行对象间ANOVA。我了解对于此类分析的适当平方和(SS)类型存在争议。但是,由于SAS和SPSS中使用的默认SS类型(III型)被认为是我所在地区的标准。因此,我希望此分析的结果与那些统计程序生成的结果完全匹配。要被接受,答案必须直接调用aov(),但其他答案可能会被投票(尤其是如果它们易于理解/使用)。 sample.data <- data.frame(IV=rep(1:4,each=20),DV=rep(c(-3,-3,1,3),each=20)+rnorm(80)) 编辑:请注意,我要求的对比度不是简单的线性或多项式对比度,而是通过理论预测得出的对比度,即Rosenthal和Rosnow讨论的对比度类型。



By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.