备忘单ANOVA字母汤和回归等效项


18

我能否获得帮助以完成此暂定(正在进行中)的尝试,以了解与ANOVA和REGRESSION等效项的含义?我一直在尝试调和这两种方法的概念,术语和语法。这个站点上有很多关于它们的共性的帖子,例如thisthis,但是在开始时有一张快速的“ you are here”地图仍然是一件好事。

我计划更新此帖子,并希望获得纠正错误的帮助。

单向方差分析:

Structure:   DV is continuous; IV is ONE FACTOR with different LEVELS.
Scenario:    miles-per-gal. vs cylinders
             Note that Income vs Gender (M, F) is a t-test.
Syntax:      fit <- aov(mpg ~ as.factor(cyl), data = mtcars); summary(fit); TukeyHSD(fit)
Regression:  fit <- lm(mpg ~ as.factor(cyl), mtcars) 
             # with F dummy coded;
             summary(fit); anova(fit)

双向方差分析:

Structure:   DV is continuous; IV is > 1 FACTORS with different LEVELS.
Scenario:    mpg ~ cylinders & carburators
Syntax:      fit <- aov(mpg ~ as.factor(cyl) + as.factor(carb), mtcars); 
             summary(fit); TukeyHSD(fit)
Regression:  fit <- lm(mpg ~ as.factor(cyl) + as.factor(carb), mtcars) 
             # with F dummy coded; 
             summary(fit); anova(fit)

双向因子方差分析:

Structure:   All possible COMBINATIONS of LEVELS are considered.
Scenario:    mpg ~ cylinders + carburetors + (4cyl/1,...8cyl/4)
Syntax:      fit <- aov(mpg ~ as.factor(cyl) * as.factor(carb), mtcars); 
             summary(fit); TukeyHSD(fit)
Regression:  fit <- lm(mpg ~ as.factor(cyl) * as.factor(carb), mtcars) 
             # with F dummy coded; 
             summary(fit); anova(fit)

安科瓦:

Structure:   DV continuous ~ Factor and continuous COVARIATE.
Scenario:    mpg ~ cylinders + weight
Syntax:      fit <- aov(mpg ~ as.factor(cyl) + wt, mtcars); summary(fit)
Regression:  fit <- lm(mpg ~ as.factor(cyl) + wt, mtcars) 
             # with F dummy coded; 
             summary(fit); anova(fit)

MANOVA:

Structure:   > 1 DVs continuous ~ 1 FACTOR ("One-way") or 2 FACTORS ("Two-way MANOVA").
Scenario:    mpg and wt ~ cylinders
Syntax:      fit <- manova(cbind(mpg,wt) ~ as.factor(cyl), mtcars); summary(fit)
Regression:  N/A

曼科瓦:

Structure:   > 1 DVs continuous ~ 1 FACTOR + 1 continuous (covariate) DV.
Scenario:    mpg and wt ~ cyl + displacement (cubic inches)
Syntax:      fit <- manova(cbind(mpg,wt) ~ as.factor(cyl) + disp, mtcars); summary(fit)
Regression:  N/A

WITHIN因子(或主题)ANOVA: 此代码

Structure:   DV continuous ~ FACTOR with each level * with subject (repeated observations).
             Extension paired t-test. Each subject measured at each level multiple times. 
Scenario:    Memory rate ~ Emotional value of words for Subjects @ Times
Syntax:      fit <- aov(Recall_Rate ~ Emtl_Value * Time + Error(Subject/Time), data); 
             summary(fit); print(model.tables(fit, "means"), digits=3);
             boxplot(Recall_Rate ~ Emtl_Value, data=data)
             with(data, interaction.plot(Time, Emtl_Value, Recall_Rate))
             with(data, interaction.plot(Subject, Emtl_Value, Recall_Rate))
             NOTE: Data should be in the LONG FORMAT (same subject in multiple rows)
Regression:  Mixed Effects
             require(lme4); require(lmerTest)
             fit <- lmer(Recall_Rate ~ Emtl_Value * Time + (1|Subject/Time), data); 
             anova(fit); summary(fit); coefficients(fit); confint(fit) 
or
             require(nlme)
             fit <- lme(Recall_Rate ~ Emtl_Value * Time, random = ~1|Subject/Time, data)
             summary(fit); anova(fit); coefficients(fit); confint(fit)

裂区:此代码

Structure:   DV continuous ~ FACTOR/-S with RANDOM EFFECTS and pseudoreplication.
Scenario:    Harvest yield ~ Factors = Irrigation / Density of seeds / Fertilizer 
                 & RANDOM EFFECTS (Blocks and plots of land): 
Syntax:      fit <- aov(yield ~ irrigation * density * fertilizer + 
                 Error(block/irrigation/density), data); summary(fit)
Regression:  Mixed Effects
             require(lme4); require(lmerTest); 
             fit <- lmer(yield ~ irrigation * fertilizer + 
             (1|block/irrigation/density), data = splityield); 
             anova(fit); summary(fit); coefficients(fit); confint(fit)
or
             library(nlme)
             fit <- lme(yield ~ irrigation * variety, random=~1|field, irrigation)
             summary(fit); anova(fit)

嵌套设计:此代码

Structure:   DV continuous ~ FACTOR/-S with pseudoreplication.
Scenario:    [Glycogen] ~ Factors = Treatment & RANDOM EFFECTS with Russian-doll effect: 
             Six rats (6 Livers)-> 3 Microscopic Slides/Liver-> 2 Readings/Slide). 
Syntax:      fit <- aov(Glycogen ~ Treatment + Error(Rat/Liver), data); summary(fit)
Regression:  Mixed Effects
             require(lme4); require(lmerTest)
             fit <- lmer(Glycogen ~ Treatment + (1|Rat/Liver), rats); 
             anova(fit); summary(fit); coefficients(fit); confint(fit)
or
             require(nlme)
             fit<-lme(Glycogen ~ Treatment, random=~1|Rat/Liver, rats)
             summary(fit); anova(fit); VarCorr(fit)

有用的网站:

  1. REx回购
  2. 个性项目
  3. 快速R
  4. R-博客
  5. M. Crawley的嵌套分析和分割图
  6. 具有多重随机效应的模型
  7. 分割图模型
  8. 克劳利的R书
  9. 组内和重复措施
  10. 在R中重复测量
  11. GLMM常见问题

注意:对于您的2向方差分析示例(直接和阶乘),您的方案/语法为cyl + hp。动力是连续的,因此在这里不起作用。carb,化油器的数量将是一个更好的选择。
格雷戈尔

谢谢!粗心的错误。感谢您的注意,我还检测到cyl被视为连续的,因此将其更改为as.factor。而且,我包括了TukeyHSD。
安东尼·帕雷拉达

1
我认为您应该从标题中删除“生存”,因为这是一个非常具体的统计领域,与您正在(非常好)总结的内容完全无关。
布赖恩·汉森

尼斯总结安东尼!也许您还可以添加Ben Bolker 撰写的glmmFAQs以及一些简单的二项式和Poisson示例(GLM和GLMM)。但是我知道,这可能会使事情变得过于复杂,从而使这篇简洁明了的摘要失去了意义。或者,您可以链接到本网站上的示例。对于完整的简单泊松/负二项式示例,这可能会起作用:stats.stackexchange.com/questions/325334/…–
Stefan

Answers:


2

不错的清单,安东尼。以下是一些小建议:

单向方差分析:IV是具有3个或更多级别的因子。您也可以在此条目中添加一个示例数据:mtcars。(类似地,您可以在所有条目中添加“ *示例数据”语句,以使您使用的数据集更加清楚。)

双向方差分析:为什么不使用IV1和IV2并声明两个独立变量应该是至少具有两个水平的因子?您目前所说的方式表明,双向方差分析可能包含两个以上的独立变量(或因子),这是无意义的。

对于双向Anova,我将在这两个子案例之间进行区分:1.具有IV1和IV2主要效果的双向Anova,以及2. IV1和IV2之间具有交互作用的双向Anova。第二个项目是您所称的两个为阶乘双向方差分析。)描述这两个子情况的更好方法是:1. IV1对DV的影响独立于IV2和IV的影响。 DV取决于IV2。您还可以更清楚地知道,在回归设置中伪编码的是独立变量IV1和IV2。

对于ANCOVA,您可以澄清一下,在当前示例中,您仅考虑单向ANCOVA。为了完整起见,您可以添加一个双向ANCOVA示例,在IV1和IV2之间没有交互,而在这两个变量之间具有交互。

对于上述所有内容,您还可以添加一个名为目的的项目,该项目描述这些分析何时有用。例如:

目的(单向方差分析):调查DV的平均值是否在IV级之间有所不同。

对于MANOVA,您能否澄清一个因素:(a)两个或更多DV,以及(2)一个或多个IV是因素?我想您可以区分单向MANOVA(具有1个因子)和两向MANOVA?MANCOVA也一样。

WITHIN-FACTOR ANOVA也被称为REPEATED MEASURES ANOVA,因此也许您可以将此术语添加到您熟悉的人员的列表中。阐明混合效应建模为建模重复测量数据提供了一种替代方法也是有帮助的。否则,读者可能不会理解这两种方法之间的差异。


它更容易为我提供建议,而不是让edits.🤗
伊莎贝拉Ghement
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.