设计和生产地块的基本规则是什么？

19

背景：

以前在交叉验证中，我们对以下问题有疑问：

@david在对该问题的评论中建议，我们应该有一个社区Wiki问题，其中每个答案都可以由一个可视化规则来进行社区投票。

题

设计和产生数据图形表示的基本规则是什么？

规则

每个答案一个规则
理想情况下，请简要说明您为什么认为这是一个好主意
最好附有良好实践和不良实践示例（代码和图像）的答案。

data-visualization

— Jeromy Anglim
source

13

形式上的实质：选择适当的图解，样式，颜色或其他图形参数，以显示您希望该图解显示的内容，而不是您的图形包装必须允许的内容。

— 方铁
source

8

（+1）我通常更喜欢先在纸上画出一个图形，以减少由图形软件创建的阻力最小的路径指导我的设计决策的机会。

— Jeromy Anglim

13

熟悉颜色的三个维度可能会有所帮助。如果您使用多种颜色，则理想情况下，它们应该在其中几个尺寸上有所不同，而不仅仅是一个。

值。该图即使是黑白也应保持可读性。此简单规则应考虑色盲，低质量的打印机和不良的照明条件。即使您使用不同的色调，也请确保这些值足够不同。特别是，在浅色背景（或相反背景）上，图应为暗色，而在灰度值上则不应为灰色。最糟糕的例子是红色背景的蓝色图-两者都是中间值，即在转换成黑白后会给出非常相似的灰度。

饱和。饱和度应适度使用：纯红线可能会很好，但较粗，饱和度较低的红线会更易读（增加的厚度有助于区分颜色并允许您降低饱和度）。另一方面，纯红色区域看起来很痛苦：请勿使用饱和色填充区域。在布鲁尔调色板（设计图，没有线图）给出的低饱和度的颜色选择的例子。最糟糕的例子还是背景饱和（红色为蓝色或红色为蓝色）。

色调。如@gung所述，请避免使用红色/绿色（交通灯）组合：色盲人群比您想象的要多得多。尤其是色相，少即是多。例如，要绘制“发散”值（即可以为正或负的数量），只需使用两种色相（对于正值和负值），以便读者可以立即区分出高和低。使用离散的渐变可以使图形更加可读：颜色之间的边界变得可见并形成轮廓图。

您可能需要阅读S. Few的《在图表中使用颜色的实用规则》，或为艺术或设计专业的学生参考有关“色彩理论”的任何材料。

— Vincent Zoonekynd
source

+1，这里的信息不错。关于价值以及转换为黑白后颜色如何呈现的观点特别好。很少论文的链接也很有帮助。注意事项：最好不要将其他答案称为“之上”，而应使用@ so-and-so代替；答案根据获得的票数而变化。

— gung-恢复莫妮卡

11

在图形本身中放置尽可能多的必需信息。请勿要求读者引用标题，例如标识各种符号或颜色的含义。将任何无法放入图形本身的信息（或补充信息）放在标题中。 这样做的目的是最大程度地减少图形查看者提取相关信息所需的工作量 -最好：图形是不言自明的，其次是最好的：可以从标题中迅速收集所需的补充信息，最坏的情况是：查看者必须仔细阅读全文在整个结果部分中，搜索一些关键的细节以弄清楚发生了什么。

— 大卫
source

1

+1，我们可以进一步扩展这个想法：我们希望使人们可以看到图表并（尽可能多地）知道发生了什么，而不必阅读标题，以及何时需要其他信息来做到这一点在标题中有可用的标题，以便人们可以阅读标题并知道他们需要什么，而不必通篇阅读该关键细节的文章。

— gung-恢复莫妮卡

1

@gung，因为这是CW，请随时编辑答案以反映您的评论。

— David LeBauer 2012年

10

使绘图尽可能简单。用Tufte的话来说，“最小化数据墨水比率”。

例如，避免：

颜色或形状超出要求
多余的刻度线
2D图上的3D效果。
当可以直接标记对象时使用图例

— 戴维·勒鲍尔
source

我在这里不同意图夫特。首先，在他的原著中，此规则的动机很大一部分是您需要花费多少时间来绘制多余的不必要的线条；但这与今天无关。其次，克利夫兰定律更好地捕捉了真实的思想，以最大化图形的信息性，因为有时绘图可以用更多的墨水变得更具信息性，但是这两个规则都违背了破坏图夫特的图表垃圾。

— gung-恢复莫妮卡

@gung图夫特（Tufte）提出的动机/所需的时间在哪里？我不记得这部分（但我也没有方便的文字）。

— David LeBauer 2012年

1

我也没有，但在他的第一本书《视觉显示》中，我记得他谈论过您放下标尺绘制图形的次数。也许“大”是个夸大的说法，但我记得读过这篇文章并想，“现在谁在乎呢？” 在Elements中，克利夫兰提出了令人信服的论点，认为塔夫特的规则是错误的。他认为关键是要最大限度地提高信息传递的效率，并表明该原理还消除了Tufte所不喜欢的东西，但允许（非他莫属的情况）额外的非数据墨水有助于使图更具信息性。

— gung-恢复莫妮卡

我应该明确指出，我不同意一些具体建议（例如，没有3D，没有图表垃圾）；我怀疑Tufte的规则是图形的指导原则。

— gung-恢复莫妮卡

@gung我将同一讨论解释为一种启发式工具，这是一种让读者理解该方法的简便方法，而不是一种减少设计人员工作的方法。

— David LeBauer 2012年

9

留时间编辑。制作一个好的图表需要花费时间，并且经常需要（至少对我来说）多次尝试。

— 彼得·弗洛姆-恢复莫妮卡
source

6

不要反对红色和绿色。 颜色可能会有所帮助，但是在使用颜色时，请始终记住，绝大多数人是红绿色色盲。我曾经向某人显示一些数据，但他无法弄清楚我的图形中发生了什么，这很浪费，我感到很愚蠢。其他形式的色盲现象非常罕见，但红绿色相当普遍。此页面有很多很好的信息。这里有一些提示：

如果只需要两种颜色，请使用蓝色和黄色-不要使用红色和绿色。
如果需要渐变，请从蓝色变为黄色，同时更改饱和度和亮度-请勿使用彩虹。
如果您需要编码两个以上的元素（例如，来自两个以上组的散点图上的点或几条线），则还可以使用不同的绘图符号/线条样式来备份您的颜色。例如，不同的绘图符号：o + <sw或线：实线，点划线，虚线，点划线等（您也可以将绘图符号添加到线中或更改线宽）。

— 功
source

我确实经常想知道这是什么：要使用的最佳颜色渐变是什么？

— steffen 2012年

4

不要使用堆积的条形图。与此相关的是，如果您有一个李克特量表项目，则无需显示每个项目的每个响应所占的比例。这些图使我的眼睛流血。

不要使用饼图。

不要通过扔到表中来复制图中包含的数据。

使用无衬线字体（例如Arial）作为图形标题等，因为这些类型的字体旨在用于这种方式。

没有书参考，就没有完整的设计文章，我真的很喜欢“ 统计规则”。第9章与此处的讨论有关，当我被问到为什么我讨厌堆积的条形图和饼形图时，我指的是这些地方。:)

告白：在我为一个小型非政府组织客户做的第一批学生咨询工作中，我给他们提供了一份报告，其中有许多堆积的彩色彩色条形图（那是1990年代中期）。我想我设法使黄色，紫色和红色变成了这些幼犬。

— 蜜雪儿
source

3

不要弄乱轴。不要仅仅因为图形的斜率看起来更令人印象深刻就削减了前一百个单位。图像会残留下来，人们会记住比实际测量的效果要大得多的效果。

— m
source

2

切断数据以改变表观斜率是欺诈行为。OTOH，存在一个真正的问题，即轴是否应始终包括0，以及所使用的长宽比（相关性稍差）。克利夫兰（Cleveland）有力的证明，如果您在数据窗口内最大化数据，并且“倾斜”到45度，则图表将更具参考价值。在这里了解您的听众：克利夫兰认为，专业听众应该被视为有能力和素养，但对于天真的听众，要么明确指出这些功能并加以解释，要么（可能）不使用它们。

— gung-恢复莫妮卡

即使是专业观众，几个月后（我认为）也只会记住图中的陡峭线，而会忘记截距和其他所有内容。通过正确标记极值，您可以在（平面）图中拥有所有这些数据，并且仍然可以在其中得到信息，实际上没有改变时间。

— xmjx 2012年

2

我不同意。我不认为坚持建议所有轴都从零开始不是明智的规则。图形应显示数据的变化和结构-如果重要的是在200万的值附近波动100,000（可能是两组之间的差异），则图形应显示，而不是“ 200万是一个很大的数字”。

— 彼得·埃利斯

与基本上任何设计规则一样，我认为如果您真正了解所绘制变体的实际意义以及听众将如何理解它，就可以打破这一规则。但是这个规则经常被违反，因此我认为大声宣布“所有地块都必须包含零！在过去的二十年中疯狂地传播，实际上最大传播率约为5％。

— 马特·帕克

并非只有5％是无关紧要的-而且大多数图都与引起波动的政策后果的争论有关。但是我认为，如果这些论点强调具有巨大经济后果的大规模政策实际上对房屋所有权的影响相对较小，那么这些论点将更加强大。

— 马特·帕克