良好的在线资源,其中包含有关在各种条件下绘制两个数值变量之间关系的图形的提示


22

内容:

一段时间以来,我获得了一系列启发式方法,可以有效地绘制两个数字变量之间的关联。我想大多数处理数据的人都会有一套相似的规则。

此类规则的示例可能是:

  • 如果变量之一正偏,请考虑在对数刻度上绘制该轴。
  • 如果数据点很多(例如n> 1000),则采用其他策略,例如使用某种形式的部分透明性或对数据进行采样;
  • 如果变量之一属于有限数量的离散类别,请考虑使用抖动或向日葵图;
  • 如果存在三个或更多变量,请考虑使用散点图矩阵;
  • 拟合某种形式的趋势线通常很有用;
  • 将绘图字符的大小调整为样本大小(对于较大的n,使用较小的绘图字符);
  • 等等。

题:

我希望能够引导学生访问一个网页或网站,该网站或网站解释了这些技巧和其他技巧,以有效地绘制两个数值变量之间的关联(也许带有示例)。

  • 互联网上有没有做得很好的页面或站点?

2
如果可以找到它,Systat的较早版本(Windows之前的版本,不管您是否相信)附带的印刷版“ Graphics”手册将是一个很好的资源。它不仅说明了所有这些规则(我记得),而且充满了精妙而出色的建议。
ub

2
@whuber,一个很好的评论。Systat的主要作者Leland Wilkinson以及《图形语法》(图形学更多的是一本计算机科学书籍,而不是一本统计书)的作者,对数据的图形显示非常有好感。他的演讲总是非常有效地传达他们的信息。
StasK 2011年

@Jeromy,您可能已经知道R 的ggplot2软件包,但是既然提到了图形语法,我也想提到它。我发现Hadley Wickham 的软件包,书籍和在线参考手册对于将数字变量转换为有用的图形和图形非常有用。
NRH

1
@Jeromy为什么不(单独)将问题改写为社区Wiki,每条规则要求一个帖子?这样,我们可以有一套可变的规则,而不是一组链接,并在此处创建资源。
David LeBauer 2011年

@David Okay,我添加了一个有关设计情节的最佳资源的一般社区wiki问题stats.stackexchange.com/questions/16631/…–
Jeromy Anglim

Answers:


13

想不起最重要的在线资源,但是一本不错的(易于下载的)书章讲述了如何以周到的方式直观地浏览大型多维数据集,这是Brendan O'Connor和Lukas Biewald的书。美丽数据(警告:链接直接指向PDF)。本章作为教学资源特别有用,因为它将R代码纳入了叙述中。

另外,经过进一步的思考,我认为John Tukey的经典著作《 Some Graphic and Semigraphics Displays》(方便地发布在Edward Tufte的网站上)是一个非常不错的视觉化介绍,尽管有点特质。

由于某种原因,我似乎在考虑本书的章节...


+1至少这些章节可以在Web上找到:我认为符合要求。谢谢,亚伦
ub

@ whuber感谢您发布赏金;和@ashaw这两个链接都引起了有趣的阅读。
Jeromy Anglim

我注意到,Tukey的文章是他在《EDA(1977)》一书中发现的扩展处理的前身(除了有关悬挂根图和直方图的最后一节)。
ub

11

最近参考:

较旧但相关的资源


3
+1规则和教程看起来非常有用,全面而且禁止!如何在不提供单个插图的情况下撰写有关图形的文章?:-)
豪伯

1
选择是困难的,但我已授予悬赏,因为总的来说,它可以最好地解决所询问的问题。联合国文件以其通俗易懂的语言和许多清晰的例子,似乎对学生特别有用且容易获得。
ub
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.