如何可视化方差分析的作用?


60

有什么方法可以直观地解释什么是方差分析?

任何引用,链接(R包?)都将受到欢迎。


克里斯托弗·马格努森(Kristoffer Magnusson)在他的博客“心理学家在统计编程中的努力”中提供了使用D3.js进行单向方差可视化的一个很好的例子rpsychologist.com/d3-one-way-anova/#comment-1891
Epifunky,2014年

我发现方差分析是一个很好的可视化工具。它不像以前的答案那样精确,但是您可以交互式地进行可视化处理。发现它很有趣:students.brown.edu/seeing-theory/regression/index.html#third
Mike

Answers:


51

我个人喜欢介绍线性回归和方差分析,方法是证明线性回归和方差分析都是相同的,并且线性模型足以划分总方差:我们在结果中存在某种方差,可以用感兴趣的因素以及无法解释的原因来解释部分(称为“剩余”)。我通常使用以下图示(灰色线表示总可变性,黑色线表示组或个体特定可变性):

替代文字

我也喜欢Michael Friendly和John Fox 的heplots R包,但也请参见多元线性模型中的视觉假设检验:R的heplots包

克里斯滕森(Christensen)在对复杂问题的平面答案中确实很好地解释了解释方差分析实际功能的标准方法,尤其是在线性模型框架中,但是很少有插图。Saville和Wood的统计方法:几何方法有一些示例,但主要涉及回归。在主要关注DoE的Montgomery的“实验设计和分析”中,有一些我喜欢的插图,但请参见下文

替代文字

(这些是我的:-)

但是我想,如果您想查看平方和,误差等如何转化为向量空间,就必须寻找有关线性模型的教科书,如Wikipedia所示。Davidson和MacKinnon撰写的《计量经济学的估计和推论》似乎有很好的插图(第一章实际上涵盖了OLS几何),但是我只浏览了法语翻译(请参见此处)。线性回归的几何也有一些很好的例证。

编辑

嗯,我只记得Robert Pruzek撰写的这篇文章,它是单向ANOVA的新图形

编辑2

现在,将granova软件包(由@ gd047提及并与上一论文相关联)已移植到ggplot,请参见granovaGG,以及下面的单向ANOVA图示。

在此处输入图片说明


第一个插图是使用R制作的吗?
乔治·唐塔斯

@ gd047是的。如果需要,应该在某处放置丑陋的源代码。第二个是在Metapost中完成的。
chl 2010年

3
@ gd047好吧,像往常一样,总是在我们找不到旧代码的时候(尽管我尽最大努力使用grep / find),所以我为此写了一个快速(仍然很丑陋)的R脚本。我还举了一个MP代码示例。
chl 2010年

令人遗憾的是,线性回归链接的几何形状似乎已经腐烂。
银鱼

23

这样的事情怎么样? 替代文字

继克劳利(2005)。统计。使用R:Wiley的介绍。


1
(+1)我让我想起了plot.design()(但您使用的是增强版本:-)
chl 2010年

这是最好的。
2012年

13

到目前为止,谢谢您的出色回答。虽然它们很有启发性,但我觉得在我目前正在教授的课程中使用它们(好吧,TA'ing)对我的学生来说太过分了。(我帮助为医学科学高级课程的学生教授BioStatistics课程)

因此,我最终创建了两个图像(两个都是基于模拟的),我认为这是解释方差分析的有用示例。

我很乐意阅读有关改进它们的评论或建议。

第一张图片显示了模拟的30个数据点,分为3个图(显示了如何将MST = Var与创建MSB和MSW的数据分离:

  • 左图显示了每组数据的散点图。
  • 中间一个显示了我们将用于MSB的数据的外观。
  • 右图显示了我们将用于MSW的数据的外观。

替代文字

第二张图片显示了4个图,每个图分别表示各组的方差和期望值的不同组合,而

  • 图的第一行用于低方差,而第二行用于高(方)方差。
  • 图表的第一列表示各组之间的期望均等,而第二列则显示具有(非常)不同期望的组。

替代文字


2
H0 μ1个=μ2==μķ H1个  一世Ĵ | μ一世μĴH1个¬ H0)。如果您能够将这些想法传达到图形显示中(在这里似乎就是这种情况),那么我认为您已经完成了。
chl 2010年

嗨,谢谢,谢谢您的积极反馈(以及您之前的详细回答)!我认为,从准备该课程的材料中学到的一些最大的按摩方法是:1)如何描述原始数据的转换,以便获得MSB和MSW方差度量。2)MSB / MSW的测试统计量实际上是单侧(而不是两侧)测试,其中H0是MSB <= MSW。最后,我只是想指出SSW = SST-SSB是正确的(但我看不到MSW = MST-MSB的真实情况)。
Tal Galili 2010年

1
ÿ一世Ĵ=μ+α一世+ε一世Ĵÿ一世Ĵ=μ一世+ε一世Ĵÿ一世Ĵ=ÿ一世¯+ε一世Ĵ=ÿ¯+ÿ¯一世-ÿ¯+ÿ一世Ĵ-ÿ¯一世ÿ一世Ĵ-ÿ¯=ÿ¯一世-ÿ¯+ÿ一世Ĵ-ÿ¯一世

12

由于我们在这篇文章中收集了某些类型的漂亮图形,因此,这是我最近发现的另一种图形,可以帮助您了解ANOVA的工作原理以及F统计量的生成方式。图形是使用R中的granova软件包创建的。 替代文字


2
(+1),我给了一个链接到罗伯特Pruzek的文章,但我不知道它是在R.可用
CHL


6

好问题。您知道,我一直在努力将自己的头缠在方差分析上很长时间。我总是发现自己回到了“在中间而在内部”的直觉,而且我一直试图想象这在我的脑海中会是什么样。我很高兴这个问题浮出水面,而以上答案中的各种方法让我感到惊讶。

无论如何,很长一段时间(甚至几年),我一直想在一个地方收集多个地块,以便可以从许多不同的方向看到同时发生的事情:1)人口有多远; 2)人口有多远?数据相距甚远,3)与内部相比,两者之间有多大; 4)中央中央 F分布如何比较?

在一个真正的伟大世界中,我什至可以玩滑块,看看样本大小如何改变事物。

因此,我一直在使用RStudio中manipulate命令,这真行!这实际上是其中的一幅图,即快照:

可视化方差分析

如果您拥有RStudio,则可以获取制作以上绘图的代码(滑块和全部)!在Github上

在玩了一段时间之后,我惊讶于F统计量如何区分这些组,即使样本量较小也是如此。当我查看人群时,它们之间的距离确实不远(在我看来),但是,“内部”条与“中间”条始终相形见war。我想每天都学点东西。


3

为了说明单向方差分析发生了什么,我有时使用了“统计学实践导论”作者提供的小程序,该程序可以让学生在方差之内和之间进行操作,并观察其对F统计量的影响。 。是链接(小程序是页面上的最后一个)。屏幕截图示例:

在此处输入图片说明

用户控制顶部滑块,从而改变三组数据的垂直范围。底部的红点沿着p值的曲线移动,同时更新下面显示的F统计信息。


2

看来这艘船已经按照答案航行了,但是我认为,如果这是入门课程,那么这里提供的大多数展示对于入门学生来说太难了……或者至少也是如此。没有介绍性的显示就很难掌握,它提供了分区差异的非常简化的解释。向他们展示SST总数如何随科目数量的增加而增加。然后,在为几个主题显示膨胀后(也许在每个组中多次添加),请说明SST = SSB + SSW(尽管我更喜欢从一开始就称其为SSE,因为在进行IMO内部测试时可以避免混淆)。然后向他们展示方差分区的可视化表示形式,例如,用大方形彩色编码,以便您可以看到SST是如何由SSB和SSW组成的。然后,


By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.