我正在进行数据可视化。每个基准用一个正方形表示。为了使基础数据直观易读,每个正方形的边长或每个正方形的面积是否应与其表示的基准成比例?
我正在进行数据可视化。每个基准用一个正方形表示。为了使基础数据直观易读,每个正方形的边长或每个正方形的面积是否应与其表示的基准成比例?
Answers:
如果您(创建者)不确定,读者将如何知道它是什么?
简短答案:该值应与页面上的颜色数量1:1链接。因此,在您的示例中,它应该是面积。但是,不仅如此:您还需要避免产生误导性提示,以免使读者错误地阅读该提示,并且您需要知道为什么使用面积而不是长度(例如条形图),因为它具有真正的优缺点。
首先,当变量实际上仅与一侧的长度相关时,形状和长度都不会改变(即面积)。如果X是Y的两倍,但是Y在页面上的颜色是它的四倍,那么您在误导读者。这种失真有时被称为“ 谎言因素 ”,通常被认为是故意误导和夸大差异的尝试。
如果您将面积作为衡量标准,我强烈建议您:
知道为什么要使用area。通过使用面积而不是长度之类的线性尺寸,您可以:
考虑使用圆形表示面积,而不是正方形,居中对齐:
例如,在上面,很难不看到标有“ 5”的正方形是标有“ 10”的正方形的四分之三的高度,因此可能会引起误解。
圈子不要求进行这种比较:它更多是直觉级的,即“那个斑点比下一个斑点大得多”。
从用户测试到小规模研究(以后将尝试寻找一些示例),有各种各样的证据表明,这种基于区域的直观比较会更具吸引力,可以降低参与程度较低的受众进入的障碍,并且可以帮助读者将注意力集中在主题上,而不是数字的冷淡细节。但这是以妨碍进行更注重数字分析的方式为代价的。
出于审美原因,请勿在一维(长度或距离)和二维(区域)之间进行选择:请根据受众和消息在它们之间进行选择。
哪一种更适合交流:在“更大”级别进行即时肠道级别的比较,或者在“大约是另一项的80%”级别更考虑数值比较?
还是有实际原因需要使用区域?
然后,出于实际原因选择后,请应用美学。
我们不善于判断长度上的差异。我们使用长度作为代理,因此倾向于低估面积差异。
因此,实际上一个面积为另一个面积的2 倍的圆看起来太小,因为我们的大脑与半径相关,半径相差1.4倍。
为了解决这种现象,我们进行了有趣的尝试,例如R中的“比例符号映射”,它提出了符号的感知缩放,以更紧密地与我们判断长度和面积的方式保持一致。
这是本文的图2
我个人对此没有任何经验,如果需要定量判断,请避免使用某些区域。
有趣的切线是对体积和长度的感知之间的关系。我们在感知这些方面的差异更加明显。这可以在录像中比较星号来说明。
通过你得到最大的明星,这是约1,700x太阳直径的时候,你留下的印象是,它是多比1,700x大。
要更系统地了解我们在感知面积和长度方面的差异时所犯的错误,请参阅Jeffrey Heer和Michael Bostock的《众包图形感知:使用Mechanical Turk评估可视化设计》。
我认为是区域(D),而不是两侧(E)。
如果您使用长度为2的一面,则面积将为该值的4倍,并且图形将非常重叠。(E)
当您具有普通的条形图(A)时,数据是线性的,并且条形图的with仅用于美观。(B)
在那些情况下,区域再次代表数据,因为条形图的相同。您可以使用3D条形图,但该条形图的音量仍然代表数据(C)
塔夫特对此进行了广泛的处理。看到:
图形完整性的一些原则:
- 在图形本身的表面上物理测量的数字表示形式,应与表示的数值量成正比
- 应当使用清晰,详细和彻底的标签来消除图形失真和歧义。在图表本身上写出数据说明。在数据中标记重要事件。
- 显示数据变化,而不是设计变化。
- 在货币的时间序列显示中,紧缩和标准化的货币计量单位几乎总是比名义单位好。
- 所描述的信息携带(可变)维度的数量不应超过数据中的维度数量。图形不得引用上下文之外的数据。
在您的情况下,您必须问自己,是否可以用2D或3D图像或线条更好地表示数据。立方体,正方形和直线不同。这就是3D条形图如此经常引起误解的原因之一。