设置图形格式：何时适合在折线图下使用填充？

13

这是一个数据可视化问题-我希望可以在这里提问。

何时适合使用线形图填充时间序列，例如下面的图？（显示一天的ping时间）

线形图，下方填充

我想使用无填充线的普通线更为常见，但是可以使用填充线来实现视觉变化吗？

我对了解有关该主题的任何感知研究或任何样式指南特别感兴趣。

data-visualization

— 理查德
source

1

如果0s是自然下限并且您将其显示出来，那为什么不呢？

— ttnphns 2014年

1

询问另一种方法-如果不需要填充，为什么要使用填充？想象一下，您想添加另一个趋势线，事情变得不必要地复杂。我还将y轴的单位和比例分开。

— 马丁

11

平衡图形的美学和信息方面有些技巧。像Edward Tufte和Stephen Few这样的杰出可视化顾问/作者选择了一种最小的美学，以避免从图表的信息部分分散注意力。但是，对于某些观众来说，少量的繁荣是有道理的-例如，请参见Alberto Cairo在数据可视化方面的新闻应用。

感知研究的角度是每个图形元素都传达一条消息，因为我们的视觉皮层会处理它，所以我们并没有意识到其中的一些信息（“ 前注意处理 ”）。额外的元素，即使是多余的元素，也可能导致额外的处理。适当的图表取决于要传达的信息和受众。

对于您的特定问题，连接的线强调趋势（以及趋势的变化）。填充区域强调与基线的偏差。条形图或针形图将强调偏离基线的离散事件。

图形的上下文也很重要。如果您有紧密堆积的图形网格，则填充将有助于将每条线与其基线关联。

最后，添加冗余图形元素/花样的另一个考虑因素是，很难用更多信息元素来扩展图形。例如，您可能想要突出显示特殊值，覆盖其他趋势线或覆盖带，例如下面的模型。

在此处输入图片说明

— an
source

1

我同意这一点。除非图表需要彩色，因为它是杂志/书籍的封面（并且市场营销人员希望将其着色），否则应该使用颜色来表示。如果该图看起来“无聊”，则罪魁祸首是以下事实：基本信息根本不是很有趣，或者以折线图格式不是很有趣。在这种情况下，在饼图，雷达图或其他东西中可能会更有用。

— rocinante 2014年

1

我建议不要使用饼图。很难感知到弧长和楔形区域的差异，而不是高度的差异。如果您不相信我，请将比例为32:34:33的饼图与同一条形图进行比较。哪一个更容易阅读？

— shadowtalker 2014年

2

我说的是笼统的说法，不是专门针对上述图表。每种图表类型都有其优点。某些图表类型并不适合所有情况。

— rocinante 2014年

4

还有两点要考虑：

如评论中所述，如果x轴不在自然的y零点，则底部填充在很大程度上不合适。这可能是因为y轴被缩放为从零以外的数字开始，或者是因为所使用的单位没有自然零解释（例如，开尔文具有自然零，而摄氏没有）。

其次，底部填充特别有效的情况是，可以将数据本身视为底部填充。例如，山高的折线图可以认为未充分填充，填充颜色表示土，而未填充表示空气。

一个相关的示例可能是计数数据。如果我们在每个x点上堆叠所有个体，则将获得条形图。如果在条形图之间进行插值有意义，我们将最终得到带有底部填充的折线图。

这张来自“定量信息的可视显示”的图像可能会更好地说明它。它显示了第二次战争期间哪些军事单位在欧洲（我认为）。在每个时间点堆叠单位会为您提供底部填充的条形图。在数据顶部绘制一条线会为您提供一个底图。

— Timcdlucas
source

2

... 第一次世界大战期间（在1917年和1918年的故事讲述了）美国军队在欧洲。

— 尼克·考克斯

@nickCox当然。不知道为什么我没有看到。

— timcdlucas 2014年

4

前两个答案涵盖了主要要点，但仍有几件事需要提及。

首先，我应该说我不同意极简的制图方法-所有多余的墨水都必须使用。分心的，无意义的变化应该发生。但是，相对于一条直线，实心区域可以更好地吸引眼球，一目了然。正如您所说，它可以添加“视觉多样性”。

但是，正如@xan所指出的那样，快速浏览也以部分潜意识的方式解释了与直线不同的区域。

面积图表示沿x轴前进时累积的总量。如果比较两个图，并且其中一个图的面积较大，则一眼便会看出，无论起始值和结束值如何，它的总面积都更大。

相反，折线图显示变化的值。重点是从一个点到另一个点的位置变化，而不是累积的总数。

那么什么时候应该使用面积图呢？

当这些值表示图表上显示的带有明确零点的明确数量时；
当该值表示每个点增加（或删除）的数量时，例如正常的每日降雨量或每月损益；
当值表示人口分布时，表示曲线下的总面积表示样本的总大小，例如不同年级学生人数的钟形曲线（基本上是平滑的直方图）。

想法是，在读取图形时，如果在x轴上取两个点，则它们之间显示的区域应表示该范围内的实际累积量。因此，如果您的值包含负数，我建议对负和正区域使用相反的颜色，以强调它们会在总数中抵消。

当您应该不使用面积图？

当零点是任意的（如在非绝对温度下，如@timcdlucas所述），无效（如在以两个值之比表示的测量值（如汇率）中）或由于空间原因未在图形上显示时；
当线条高度显示的值已经表示累积度量时，例如迄今为止的总降雨量（月/年）或债务/储蓄；
当这些值表示单个更改实体的位置/值而不是累加时；
当您想在同一张图表上比较多条线时（如果看不到整个区域，您将失去意义，而是并排比较区域图表）。

牢记这些准则，可以用两种方式解释ping图。

一方面，如果您将ping速度视为一个随日变化的变量，那么简单的折线图将是最合适的。

另一方面，如果要比较两个不同网络的每日ping速度模式（或同一网络在不同的日期/时间段），则可能要强调网络任务所需的总时间。例如，如果您的图形有多个峰而不是仅一个峰，则线图将强调速度的变化，而面积图则将强调总延迟。

比较：
线形图具有填充区域的同一图形
图形的前半部分（红线左侧）的累积总数略大于下半部分，即使峰值达到右侧的较高最大值。填充强调左侧的实心块，以便更好地平衡峰。

（请原谅不良的图像质量-无法弄清楚如何使用R来绘制面积图！必须单独导出和编辑。）

— 阿米莉亚
source