Answers:
SO
: stackoverflow.com/questions/6973394/...
我们可能会整日呆在这里,代表最佳做法,但是您应该先阅读Tufte。我的主要建议:
把事情简单化。
人们经常尝试在图表中加载信息。但是,您实际上应该只是想传达一个主要想法,如果有人几乎没有立即收到您的信息,那么您应该重新考虑如何呈现它。因此,在消息本身清楚之前,不要开始处理图表。奥卡姆剃刀也适用于此。
我并不总是遵循的一条经验法则,但有时会有用,它是考虑到您的情节在将来的某个时候可能是
您需要尝试使您的图足够清晰,以使即使将来对其进行不精确的复制,该图试图传达的信息仍然清晰可辨。
除了传达清晰的信息外,我还总是想起绘图技巧:
我已经将我的绘图软件(matplotlib,ROOT或root2matplotlib)配置为默认情况下可以执行大多数操作。在我使用之前gnuplot
,这里需要特别注意。
这是我的指南,基于我看到的最常见错误(除了提到的所有其他优点)
看看R图形库ggplot2。有关详细信息,请访问网页http://had.co.nz/ggplot2/。此软件包可生成非常好的默认图,该图遵循Tufte原则,克利夫兰准则和Ihaka的颜色软件包。
如果进行彩色绘图,请考虑色盲人士可能难以仅凭颜色区分元素。所以:
这些都是很棒的建议。我们在http://biostat.mc.vanderbilt.edu/StatGraphCourse上收集了很多资料。制药行业,学术界和FDA的一组统计学家也在创造一种资源,这将对临床试验和相关研究非常有用。一个月内将发布许多新材料,但已经有很多新材料-http: //www.ctspedia.org/do/view/CTSpedia/PageOneStatGraph
我个人最喜欢的图画书是William Cleveland 撰写的Elements of Graphing Data。
在软件方面,我认为很难击败R的ggplot2和grid软件包。Stata还支持一些出色的图形。
它还取决于您不希望在何处发布绘图。在为期刊做任何图之前,请先咨询作者指南,以免麻烦。
还应以易于修改的格式保存图,或保存用于创建图的代码。您可能需要进行更正。
不要使用炸药图:http : //pablomarin-garcia.blogspot.com/2010/02/why-dynamite-plots-are-bad.html,请使用小提琴图或类似形式(箱式图家族)
其他答案过于笼统,难以令人信服,因此让我给出一个更笼统的答案。我已经为这个问题苦了一段时间。我提供以下过程:
我对诸如“保持简单”之类的笼统说法表示怀疑,这是什么意思?好吧,这取决于听众。一些观众会吃饱Tufte风格的。但是有些观众会不时地欣赏一些图表垃圾。有些人对散点图感到无聊。有些人喜欢彩色背景。即使损害“审美”的纯洁度,让他们多一点参与是那么错误吗?由您决定。
听众的反应将是重要的反馈,但不是唯一的。如果你找到一个方法来衡量他们的理解之前和之后您的演示文稿,那么你就会开始明白你所做的影响。
“正确”的答案将取决于以下类型的问题:
您将使用哪种媒体?
您要创建静态图还是交互式图?
您是要讲一个预先定义的故事(博览会)还是鼓励实验(探索)?
您希望听众在何种程度上得出自己的结论?
您希望观众在多大程度上跟随并相信您的故事?
您希望听众在多大程度上挑战您的发现?
总而言之,请根据您的信息,受众和约束条件故意设计材料。
我似乎还记得Tufte提到的一件事,而在其他答案中却没有,那就是映射 -即,使图形上的位置,方向,大小等代表现实。图上显示的内容应该在现实世界中显示。大应该大(记住,面积应该代表面积和体积。不要试图用面积代表标量值,这是非常含糊的!)。如果相关,这也适用于颜色,形状等。
一个有趣的示例是此处的“裙系列”图:http : //a-little-book-of-r-for-time-series.readthedocs.org/en/latest/src/timeseries.html。从技术上讲这是正确的,并且“更短”的裙边长度在图表上占据较高的位置,但实际上相当令人困惑,因为裙边长度从顶部开始,然后向下(与人或树木不同,我们从此处测量高度)地面)。因此,增加的裙边长度实际上表示一个较低的值:
skirts <- scan("http://robjhyndman.com/tsdldata/roberts/skirts.dat",skip=5)
skirtsseries <- ts(skirts,start=c(1866))
plot.ts(skirtsseries, ylim=c(max(skirts),min(skirts)))
一如既往,有困难。例如,我们通常考虑前进的时间,至少在西方,我们从左到右阅读,因此时间序列图通常也随着时间的增加从左到右流动。那么,如果您想随着时间的推移最好地表示横向最好的东西(例如东西的东西测量),会发生什么呢?在这种情况下,您必须做出让步,要么描绘时间向上或向下移动(我猜这又取决于文化观念),要么选择将横向变量映射到图形上的向上/向下。
我要补充一点,地块的选择应反映用于分析数据的统计检验的类型。换句话说,用于分析的数据的任何特征都应以视觉方式显示-因此,如果您使用t检验,则将显示均值和标准差,而如果使用曼恩-惠特尼检验,则将显示箱线图。