有什么方法可以直观地解释什么是方差分析?
任何引用,链接(R包?)都将受到欢迎。
有什么方法可以直观地解释什么是方差分析?
任何引用,链接(R包?)都将受到欢迎。
Answers:
我个人喜欢介绍线性回归和方差分析,方法是证明线性回归和方差分析都是相同的,并且线性模型足以划分总方差:我们在结果中存在某种方差,可以用感兴趣的因素以及无法解释的原因来解释部分(称为“剩余”)。我通常使用以下图示(灰色线表示总可变性,黑色线表示组或个体特定可变性):
我也喜欢Michael Friendly和John Fox 的heplots R包,但也请参见多元线性模型中的视觉假设检验:R的heplots包。
克里斯滕森(Christensen)在对复杂问题的平面答案中确实很好地解释了解释方差分析实际功能的标准方法,尤其是在线性模型框架中,但是很少有插图。Saville和Wood的统计方法:几何方法有一些示例,但主要涉及回归。在主要关注DoE的Montgomery的“实验设计和分析”中,有一些我喜欢的插图,但请参见下文
(这些是我的:-)
但是我想,如果您想查看平方和,误差等如何转化为向量空间,就必须寻找有关线性模型的教科书,如Wikipedia所示。Davidson和MacKinnon撰写的《计量经济学的估计和推论》似乎有很好的插图(第一章实际上涵盖了OLS几何),但是我只浏览了法语翻译(请参见此处)。线性回归的几何也有一些很好的例证。
编辑:
嗯,我只记得Robert Pruzek撰写的这篇文章,它是单向ANOVA的新图形。
编辑2
现在,将granova软件包(由@ gd047提及并与上一论文相关联)已移植到ggplot,请参见granovaGG,以及下面的单向ANOVA图示。
到目前为止,谢谢您的出色回答。虽然它们很有启发性,但我觉得在我目前正在教授的课程中使用它们(好吧,TA'ing)对我的学生来说太过分了。(我帮助为医学科学高级课程的学生教授BioStatistics课程)
因此,我最终创建了两个图像(两个都是基于模拟的),我认为这是解释方差分析的有用示例。
我很乐意阅读有关改进它们的评论或建议。
第一张图片显示了模拟的30个数据点,分为3个图(显示了如何将MST = Var与创建MSB和MSW的数据分离:
第二张图片显示了4个图,每个图分别表示各组的方差和期望值的不同组合,而
好问题。您知道,我一直在努力将自己的头缠在方差分析上很长时间。我总是发现自己回到了“在中间而在内部”的直觉,而且我一直试图想象这在我的脑海中会是什么样。我很高兴这个问题浮出水面,而以上答案中的各种方法让我感到惊讶。
无论如何,很长一段时间(甚至几年),我一直想在一个地方收集多个地块,以便可以从许多不同的方向看到同时发生的事情:1)人口有多远; 2)人口有多远?数据相距甚远,3)与内部相比,两者之间有多大; 4)中央与非中央 F分布如何比较?
在一个真正的伟大世界中,我什至可以玩滑块,看看样本大小如何改变事物。
因此,我一直在使用RStudio中的manipulate
命令,这真行!这实际上是其中的一幅图,即快照:
如果您拥有RStudio,则可以获取制作以上绘图的代码(滑块和全部)!在Github上。
在玩了一段时间之后,我惊讶于F统计量如何区分这些组,即使样本量较小也是如此。当我查看人群时,它们之间的距离确实不远(在我看来),但是,“内部”条与“中间”条始终相形见war。我想每天都学点东西。