设置图形格式:何时适合在折线图下使用填充?


13

这是一个数据可视化问题-我希望可以在这里提问。

何时适合使用线形图填充时间序列,例如下面的图?(显示一天的ping时间)

线形图,​​下方填充

我想使用无填充线的普通线更为常见,但是可以使用填充线来实现视觉变化吗?

我对了解有关该主题的任何感知研究或任何样式指南特别感兴趣。


1
如果0s是自然下限并且您将其显示出来,那为什么不呢?
ttnphns 2014年

1
询问另一种方法-如果不需要填充,为什么要使用填充?想象一下,您想添加另一个趋势线,事情变得不必要地复杂。我还将y轴的单位和比例分开。
马丁

Answers:


11

平衡图形的美学和信息方面有些技巧。像Edward Tufte和Stephen Few这样的杰出可视化顾问/作者选择了一种最小的美学,以避免从图表的信息部分分散注意力。但是,对于某些观众来说,少量的繁荣是有道理的-例如,请参见Alberto Cairo在数据可视化方面的新闻应用。

感知研究的角度是每个图形元素都传达一条消息,因为我们的视觉皮层会处理它,所以我们并没有意识到其中的一些信息(“ 前注意处理 ”)。额外的元素,即使是多余的元素,也可能导致额外的处理。适当的图表取决于要传达的信息和受众。

对于您的特定问题,连接的线强调趋势(以及趋势的变化)。填充区域强调与基线的偏差。条形图或针形图将强调偏离基线的离散事件。

图形的上下文也很重要。如果您有紧密堆积的图形网格,则填充将有助于将每条线与其基线关联。

最后,添加冗余图形元素/花样的另一个考虑因素是,很难用更多信息元素来扩展图形。例如,您可能想要突出显示特殊值,覆盖其他趋势线或覆盖带,例如下面的模型。

在此处输入图片说明


1
我同意这一点。除非图表需要彩色,因为它是杂志/书籍的封面(并且市场营销人员希望将其着色),否则应该使用颜色来表示。如果该图看起来“无聊”,则罪魁祸首是以下事实:基本信息根本不是很有趣,或者以折线图格式不是很有趣。在这种情况下,在饼图,雷达图或其他东西中可能会更有用。
rocinante 2014年

1
我建议不要使用饼图。很难感知到弧长和楔形区域的差异,而不是高度的差异。如果您不相信我,请将比例为32:34:33的饼图与同一条形图进行比较。哪一个更容易阅读?
shadowtalker 2014年

2
我说的是笼统的说法,不是专门针对上述图表。每种图表类型都有其优点。某些图表类型并不适合所有情况。
rocinante 2014年

4

还有两点要考虑:

如评论中所述,如果x轴不在自然的y零点,则底部填充在很大程度上不合适。这可能是因为y轴被缩放为从零以外的数字开始,或者是因为所使用的单位没有自然零解释(例如,开尔文具有自然零,而摄氏没有)。

其次,底部填充特别有效的情况是,可以将数据本身视为底部填充。例如,山高的折线图可以认为未充分填充,填充颜色表示土,而未填充表示空气。

一个相关的示例可能是计数数据。如果我们在每个x点上堆叠所有个体,则将获得条形图。如果在条形图之间进行插值有意义,我们将最终得到带有底部填充的折线图。

这张来自“定量信息的可视显示”的图像可能会更好地说明它。它显示了第二次战争期间哪些军事单位在欧洲(我认为)。在每个时间点堆叠单位会为您提供底部填充的条形图。在数据顶部绘制一条线会为您提供一个底图。


2
... 第一次世界大战期间(在1917年和1918年的故事讲述了)美国军队在欧洲。
尼克·考克斯

@nickCox当然。不知道为什么我没有看到。
timcdlucas 2014年

4

前两个答案涵盖了主要要点,但仍有几件事需要提及。

首先,我应该说我不同意极简的制图方法-所有多余的墨水都必须使用。分心的,无意义的变化应该发生。但是,相对于一条直线,实心区域可以更好地吸引眼球,一目了然。正如您所说,它可以添加“视觉多样性”。

但是,正如@xan所指出的那样,快速浏览也以部分潜意识的方式解释了与直线不同的区域。

面积图表示沿x轴前进时累积的总量。如果比较两个图,并且其中一个图的面积较大,则一眼便会看出,无论起始值和结束值如何,它的总面积都更大。

相反,折线图显示变化的值。重点是从一个点到另一个点的位置变化,而不是累积的总数。

那么什么时候应该使用面积图呢?

  • 当这些值表示图表上显示的带有明确零点的明确数量时;
  • 当该值表示每个点增加(或删除)的数量时,例如正常的每日降雨量或每月损益;
  • 当值表示人口分布时,表示曲线下的总面积表示样本的总大小,例如不同年级学生人数的钟形曲线(基本上是平滑的直方图)。

想法是,在读取图形时,如果在x轴上取两个点,则它们之间显示的区域应表示该范围内的实际累积量。因此,如果您的值包含负数,我建议对负和正区域使用相反的颜色,以强调它们会在总数中抵消。

您应该使用面积图?

  • 当零点是任意的(如在非绝对温度下,如@timcdlucas所述),无效(如在以两个值之比表示的测量值(如汇率)中)或由于空间原因未在图形上显示时;
  • 当线条高度显示的值已经表示累积度量时,例如迄今为止的总降雨量(月/年)或债务/储蓄;
  • 当这些值表示单个更改实体的位置/值而不是累加时;
  • 当您想在同一张图表上比较多条线时(如果看不到整个区域,您将失去意义,而是并排比较区域图表)。

牢记这些准则,可以用两种方式解释ping图。

一方面,如果您将ping速度视为一个随日变化的变量,那么简单的折线图将是最合适的。

另一方面,如果要比较两个不同网络的每日ping速度模式(或同一网络在不同的日期/时间段),则可能要强调网络任务所需的时间。例如,如果您的图形有多个峰而不是仅一个峰,则线图将强调速度的变化,而面积图则将强调总延迟。

比较:
线形图 具有填充区域的同一图形
图形的前半部分(红线左侧)的累积总数略大于下半部分,即使峰值达到右侧的较高最大值。填充强调左侧的实心块,以便更好地平衡峰。

(请原谅不良的图像质量-无法弄清楚如何使用R来绘制面积图!必须单独导出和编辑。)

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.