Questions tagged «anova»

ANOVA代表AAnalysis Of VAriance,这是一种统计模型和一组用于比较多个组均值的程序。ANOVA模型中的自变量是分类的,但是ANOVA表也可以用于测试连续变量。

1
为什么在论文中很少报道Anova结果中使用哪种平方和?
根据我短暂的统计经验,似乎用于获得方差分析结果的平方和类型(I,II,III,IV等)可能会极大地影响测试结果(尤其是存在相互作用且缺失的模型)数据)。但是,我还没有看到一篇报告它的论文。为什么会这样? 如果有人能提供一种示例文件以某种方式报告该报告(而不是统计信息本身),或者不常见的原因,我将不胜感激。

1
如何使用方差分析进行两个模型的比较?
anova比较两个模型时应如何理解结果? 例: Res.Df RSS Df Sum of Sq F Pr(>F) 1 9 54.032 2 7 4.632 2 49.4 37.329 0.0001844 *** 该手册页指出:“为一个或多个拟合模型对象计算方差(或偏差)表的分析”。但是,一位教授提到,可以将其用于模型比较-这就是我打算做的。 因此,我假设我可以使用anova(model1, model2)并获得一个p值,该值告诉我是否应该拒绝原假设:“模型相同”。 我是否可以说,如果p值小于(比如说)0.05,则模型存在显着差异?
9 r  regression  anova 

1
GLMM的Anova III型测试
我正在R包中拟合glmer模型lme4。我正在寻找其中显示p值的方差分析表,但找不到适合它的包装。有可能在R中做到吗? 我适合的模型具有以下形式: model1<-glmer(dmn~period*teethTreated+(1|fullName), family="poisson", data=subset(dataset, group=='Four times a year'), control=glmerControl(optimizer="bobyqa"))


1
R:方差分析和线性回归
我是统计学的新手,我试图了解ANOVA和线性回归之间的区别。我正在使用R进行探索。我阅读了许多有关为何方差分析和回归分析为何不同但仍然相同以及如何可视化等方面的文章。我认为我的确很不错,但仍然缺少一点。 我了解到,方差分析将组内的方差与组间的方差进行比较,以确定任何测试组之间是否存在差异。(https://controls.engin.umich.edu/wiki/index.php/Factor_analysis_and_ANOVA) 对于线性回归,我在该论坛上找到了一篇帖子,其中说到当我们测试b(斜率)= 0时,也可以进行测试。) 对于两个以上的小组,我发现一个网站指出: 零假设是:H0:µ1=µ2=µ3H0:µ1=µ2=µ3\text{H}_0: µ_1 = µ_2 = µ_3 线性回归模型为:y=b0+b1X1+b2X2+ey=b0+b1X1+b2X2+Ëy = b_0 + b_1X_1 + b_2X_2 + e 但是,线性回归的输出是一组的截距,其他两组的截距之差。(http://www.real-statistics.com/multiple-regression/anova-using-regression/) 对我来说,这看起来像是实际上比较了截距,而不是斜率? 在这里可以找到截距而不是斜率的另一个示例:(http://www.theanalysisfactor.com/why-anova-and-linear-regression-are-the-same-analysis/) 我现在正在努力了解线性回归中实际比较的是什么?斜坡,拦截或两者兼而有之?
9 r  regression  anova 

1
III型平方和
我有一个带有类别变量的线性回归模型 一个一个A(男性和女性)和一个连续可变。乙乙B 我在的R中设置了对比代码options(contrasts=c("contr.sum","contr.poly"))。现在,我有了,以及它们之间的相互作用(A:B)的类型III平方和。一个一个A乙乙Bdrop1(model, .~., test="F") 我坚持的是如何为计算平方和。我乙乙B认为是sum((predicted y of the full model - predicted y of the reduced model)^2)。简化的模型看起来像y~A+A:B。但是当我使用时predict(y~A+A:B),R返回的预测值与完整模型的预测值相同。因此,平方和将为0。 (对于 一个一个A,我使用的简化模型y~B+A:B,该模型与相同y~A:B。) 这是随机生成的数据的示例代码: A<-as.factor(rep(c("male","female"), each=5)) set.seed(1) B<-runif(10) set.seed(5) y<-runif(10) model<-lm(y~A+B+A:B) options(contrasts = c("contr.sum","contr.poly")) #type3 sums of squares drop1(model, .~., test="F") #or same result: library(car) Anova(lm(y~A+B+A:B),type="III") #full model predFull<-predict(model) #Calculate sum of squares …

1
如何比较观察到的事件与预期的事件?
假设我有一个频率为4个可能的事件的样本: Event1 - 5 E2 - 1 E3 - 0 E4 - 12 并且我具有发生事件的预期概率: p1 - 0.2 p2 - 0.1 p3 - 0.1 p4 - 0.6 利用我四个事件的观测频率之和(18),我可以计算事件的预期频率,对吗? expectedE1 - 18 * 0.2 = 3.6 expectedE2 - 18 * 0.1 = 1.8 expectedE1 - 18 * 0.1 = 1.8 expectedE1 - …
9 r  statistical-significance  chi-squared  multivariate-analysis  exponential  joint-distribution  statistical-significance  self-study  standard-deviation  probability  normal-distribution  spss  interpretation  assumptions  cox-model  reporting  cox-model  statistical-significance  reliability  method-comparison  classification  boosting  ensemble  adaboost  confidence-interval  cross-validation  prediction  prediction-interval  regression  machine-learning  svm  regularization  regression  sampling  survey  probit  matlab  feature-selection  information-theory  mutual-information  time-series  forecasting  simulation  classification  boosting  ensemble  adaboost  normal-distribution  multivariate-analysis  covariance  gini  clustering  text-mining  distance-functions  information-retrieval  similarities  regression  logistic  stata  group-differences  r  anova  confidence-interval  repeated-measures  r  logistic  lme4-nlme  inference  fiducial  kalman-filter  classification  discriminant-analysis  linear-algebra  computing  statistical-significance  time-series  panel-data  missing-data  uncertainty  probability  multivariate-analysis  r  classification  spss  k-means  discriminant-analysis  poisson-distribution  average  r  random-forest  importance  probability  conditional-probability  distributions  standard-deviation  time-series  machine-learning  online  forecasting  r  pca  dataset  data-visualization  bayes  distributions  mathematical-statistics  degrees-of-freedom 

2
混合模型的参数,半参数和非参数引导
接下来的嫁接摘自本文。我是新手,要引导并尝试为带有R boot包的线性混合模型实现参数,半参数和非参数自举。 R代码 这是我的R代码: library(SASmixed) library(lme4) library(boot) fm1Cult <- lmer(drywt ~ Inoc + Cult + (1|Block) + (1|Cult), data=Cultivation) fixef(fm1Cult) boot.fn <- function(data, indices){ data <- data[indices, ] mod <- lmer(drywt ~ Inoc + Cult + (1|Block) + (1|Cult), data=data) fixef(mod) } set.seed(12345) Out <- boot(data=Cultivation, statistic=boot.fn, R=99) Out 问题 …
9 r  mixed-model  bootstrap  central-limit-theorem  stable-distribution  time-series  hypothesis-testing  markov-process  r  correlation  categorical-data  association-measure  meta-analysis  r  anova  confidence-interval  lm  r  bayesian  multilevel-analysis  logit  regression  logistic  least-squares  eda  regression  notation  distributions  random-variable  expected-value  distributions  markov-process  hidden-markov-model  r  variance  group-differences  microarray  r  descriptive-statistics  machine-learning  references  r  regression  r  categorical-data  random-forest  data-transformation  data-visualization  interactive-visualization  binomial  beta-distribution  time-series  forecasting  logistic  arima  beta-regression  r  time-series  seasonality  large-data  unevenly-spaced-time-series  correlation  statistical-significance  normalization  population  group-differences  demography 


2
测试组之间(某些)分位数Q的差异?
对于某些分为三个组(X)的Y变量,我希望对各组进行比较,并假设所有三个组之间90%的分位数相同。我可以使用哪些测试? 我能想到的一种选择是使用分位数回归,还有其他选择/方法吗? 我想如果我想比较中位数,就可以使用kruskal wallis检验(尽管它是基于等级的,但是如果我没记错的话,当残差分布是对称的时,它也会给出相同的结果) 谢谢。

2
了解重复测量方差分析假设以正确解释SPSS输出
我正在调查不同的奖励条件是否会影响任务绩效。我有一个小型研究的数据,该研究分为两组,每组n = 20。我收集了一项涉及在3种不同“奖励”条件下的性能的任务的数据。这项任务涉及在3种情况下的两次表现,但以随机顺序进行。我想看看在每个不同的“奖励”条件下,每个小组的任务绩效是否存在平均差异。 IV =组类型 DV = 3种条件下任务绩效的平均值 我从重复测量方差分析中获得了输出,并可以访问SPSS中的原始数据集,但是不确定如何进行。由于Pallant的文字有些局限,因此我无法找到这种解释的分步指南。我的特殊问题包括以下几个方面: 我应该单独检查每个变量的正常性还是在IV的每个级别的组合中检查其正常性?如果组合使用,如何检查? 我要先检查莫赫利测验吗?如果违反,那是什么意思?如果没有违反,那意味着什么? 什么时候可以查看多元测试表或受试者内部效应的测试?我不确定何时使用这两个(或两者兼而有之)? 看看成对比较总是可以吗?如果多变量或受试者内效应未显示显着性(即P <0.05),则这样做似乎是违反直觉的,但我再次不确定。

1
控制和治疗之间的差异应该显式还是隐式建模?
给出以下实验设置: 从受试者中采集多个样品,并对每个样品进行多种处理(包括对照治疗)。主要有趣的是对照和每种处理之间的差异。 我可以为这个数据想到两个简单的模型。以样本,处理,处理0为对照,令为数据,为样本的基线,为处理的差。第一个模型同时考虑了控制和差异:一世iiĴjjÿ我ĴYijY_{ij}γ一世γi\gamma_i一世iiδĴδj\delta_jĴjj ÿ我Ĵ=γ一世+δĴ+ϵ我ĴYij=γi+δj+ϵij Y_{ij}=\gamma_i+\delta_j+\epsilon_{ij} δ0= 0δ0=0 \delta_0=0 虽然第二种模型仅着眼于差异。如果我们预先计算预先 然后 d我Ĵdijd_{ij}d我Ĵ=ÿ我Ĵ-ÿ我0dij=Yij−Yi0 d_{ij}=Y_{ij}-Y_{i0} d我Ĵ=δĴ+ε我Ĵdij=δj+εij d_{ij}=\delta_j+\varepsilon_{ij} 我的问题是这两种设置之间的根本区别是什么?尤其是,如果这些级别本身没有意义,而只有差异很重要,那么第一个模型是否做得太多并且动力不足?


2
成对的重复测量方差分析还是混合模型?
我被要求分析来自临床试验的一些数据,以寻找两种测量血压的方法。我有来自50个主题的数据,每个主题使用每种方法的测量范围介于2到57个之间。 我想知道如何最好地进行。 显然,我需要一个解决方案,该解决方案应考虑以下事实:血压测量值是成对的(两种方法同时测量),还需要时变协变量(每个患者的观察次数不同),以及患者可变性。 我曾想过以某种方式将其纳入重复测量方差分析中,但我想可能需要采用混合模型方法。 我会很感激您能提供的任何有用的建议。 我是R的新手,但是对开发技能感到非常兴奋,并且我在Stata拥有一定的经验,因此可以随时依靠。
9 r  anova  mixed-model  stata 


By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.