内容:
一段时间以来,我获得了一系列启发式方法,可以有效地绘制两个数字变量之间的关联。我想大多数处理数据的人都会有一套相似的规则。
此类规则的示例可能是:
- 如果变量之一正偏,请考虑在对数刻度上绘制该轴。
- 如果数据点很多(例如n> 1000),则采用其他策略,例如使用某种形式的部分透明性或对数据进行采样;
- 如果变量之一属于有限数量的离散类别,请考虑使用抖动或向日葵图;
- 如果存在三个或更多变量,请考虑使用散点图矩阵;
- 拟合某种形式的趋势线通常很有用;
- 将绘图字符的大小调整为样本大小(对于较大的n,使用较小的绘图字符);
- 等等。
题:
我希望能够引导学生访问一个网页或网站,该网站或网站解释了这些技巧和其他技巧,以有效地绘制两个数值变量之间的关联(也许带有示例)。
- 互联网上有没有做得很好的页面或站点?
2
如果可以找到它,Systat的较早版本(Windows之前的版本,不管您是否相信)附带的印刷版“ Graphics”手册将是一个很好的资源。它不仅说明了所有这些规则(我记得),而且充满了精妙而出色的建议。
—
ub
@whuber,一个很好的评论。Systat的主要作者Leland Wilkinson以及《图形语法》(图形学更多的是一本计算机科学书籍,而不是一本统计书)的作者,对数据的图形显示非常有好感。他的演讲总是非常有效地传达他们的信息。
—
StasK 2011年
@Jeromy为什么不(单独)将问题改写为社区Wiki,每条规则要求一个帖子?这样,我们可以有一套可变的规则,而不是一组链接,并在此处创建资源。
—
David LeBauer 2011年
@David Okay,我添加了一个有关设计情节的最佳资源的一般社区wiki问题stats.stackexchange.com/questions/16631/…–
—
Jeromy Anglim