正方形的面积或长度是否应该与要可视化的数据成比例？

16

我正在进行数据可视化。每个基准用一个正方形表示。为了使基础数据直观易读，每个正方形的边长或每个正方形的面积是否应与其表示的基准成比例？

— 邓布利达
source

1

还没。它广泛吗？我希望答案是确定的（我假设它是“区域”），但是这里的人们会拥有更多的图形设计和感知心理学知识来支持这一点。

— dumbledad 2015年

1

在IIRC上，我读过一本德语书，即en.wikipedia.org/wiki/Walter_Krämer所写的“ Soüstat mit Statistik” -不知道是否有英文本。TL; DR-取决于您希望读者从可视化内容中读取什么。

— Michael Schumacher

答案当然是不确定的。这一切都取决于细节-即您要呈现的数据是什么，呈现方式以及要与所述数据进行通信的内容。

— 2015年

您能否举一些例子，这些细节或我们希望读者从可视化中阅读的内容将导致我们选择使正方形的边长与基准成正比，而不是正方形的面积？

— dumbledad 2015年

5

+1为什么每个有趣的问题都会吸引至少一票？<

— grump

10

如果您（创建者）不确定，读者将如何知道它是什么？

简短答案：该值应与页面上的颜色数量1：1链接。因此，在您的示例中，它应该是面积。但是，不仅如此：您还需要避免产生误导性提示，以免使读者错误地阅读该提示，并且您需要知道为什么使用面积而不是长度（例如条形图），因为它具有真正的优缺点。

首先，当变量实际上仅与一侧的长度相关时，形状和长度都不会改变（即面积）。如果X是Y的两倍，但是Y在页面上的颜色是它的四倍，那么您在误导读者。这种失真有时被称为“ 谎言因素 ”，通常被认为是故意误导和夸大差异的尝试。

在此处输入图片说明

如果您将面积作为衡量标准，我强烈建议您：

知道为什么要使用area。通过使用面积而不是长度之类的线性尺寸，您可以：
- 牺牲从数学上清楚看到差异的能力（您不能轻易说出“外观，是其他外观的两倍”）
- 邀请您的读者以直观的日常非数字方式查看它，例如，人们在商店中比较馅饼的大小。不太复杂，但更直接。更多的肠子，更少的头。
- 非常相似的数字之间的微小差异几乎变得不可见。
- 当一个变量比另一个变量小很多倍时，很小的变量不会像条形图中那样严重消失，这可以使布局具有更大的灵活性。

在此处输入图片说明

考虑使用圆形表示面积，而不是正方形，居中对齐：
- 圈出，因为它不会引起对条形图等的混淆。高度和宽度不太重要：看起来不太像您在邀请基于高度或宽度的比较。
- 居中对齐，因为它不会邀请人们比较身高

在此处输入图片说明

例如，在上面，很难不看到标有“ 5”的正方形是标有“ 10”的正方形的四分之三的高度，因此可能会引起误解。

圈子不要求进行这种比较：它更多是直觉级的，即“那个斑点比下一个斑点大得多”。

从用户测试到小规模研究（以后将尝试寻找一些示例），有各种各样的证据表明，这种基于区域的直观比较会更具吸引力，可以降低参与程度较低的受众进入的障碍，并且可以帮助读者将注意力集中在主题上，而不是数字的冷淡细节。但这是以妨碍进行更注重数字分析的方式为代价的。

出于审美原因，请勿在一维（长度或距离）和二维（区域）之间进行选择：请根据受众和消息在它们之间进行选择。

哪一种更适合交流：在“更大”级别进行即时肠道级别的比较，或者在“大约是另一项的80％”级别更考虑数值比较？

还是有实际原因需要使用区域？

然后，出于实际原因选择后，请应用美学。

— user56reinstatemonica8
source

“与页面上的颜色数量成比例”是一个非常有用的经验法则（至少在2D模式下）；谢谢，我会用它。我要转到的设计基于圈子，我认为您就在那里

— dumbledad

5

我会说这个地区。从光学上讲，一个边长为两倍的正方形显示的面积是四倍大的面积。即使没有阅读您的传说，随便观察员也会与该地区相关。

一个很好的例子是xkcd的Randall Munroe的这张传奇图：

在此处输入图片说明（巨大，清晰的版本）

— 文森特
source

4

我们不善于判断长度上的差异。我们使用长度作为代理，因此倾向于低估面积差异。

因此，实际上一个面积为另一个面积的2 倍的圆看起来太小，因为我们的大脑与半径相关，半径相差1.4倍。

为了解决这种现象，我们进行了有趣的尝试，例如R中的“比例符号映射”，它提出了符号的感知缩放，以更紧密地与我们判断长度和面积的方式保持一致。

这是本文的图2

在此处输入图片说明

我个人对此没有任何经验，如果需要定量判断，请避免使用某些区域。

有趣的切线是对体积和长度的感知之间的关系。我们在感知这些方面的差异更加明显。这可以在录像中比较星号来说明。

通过你得到最大的明星，这是约1,700x太阳直径的时候，你留下的印象是，它是多比1,700x大。

要更系统地了解我们在感知面积和长度方面的差异时所犯的错误，请参阅Jeffrey Heer和Michael Bostock的《众包图形感知：使用Mechanical Turk评估可视化设计》。

— 马丁·克尔兹温斯基（Martin Krzywinski）
source

4

我认为是区域（D），而不是两侧（E）。

如果您使用长度为2的一面，则面积将为该值的4倍，并且图形将非常重叠。（E）

当您具有普通的条形图（A）时，数据是线性的，并且条形图的with仅用于美观。（B）

在那些情况下，区域再次代表数据，因为条形图的相同。您可以使用3D条形图，但该条形图的音量仍然代表数据（C）

图表说明了尺寸差异和重叠

— 拉斐尔
source

4次？线性和平方之间的区别不是吗？

— dumbledad 2015年

让我阐述和编辑帖子。

— 拉斐尔

假设基准为81。如果使用面积，则侧面的长度为9，得出面积为81。如果我们使用侧面，则侧面的长度为81，面积为6,561。81不是4乘以9，而6,561不是4乘以81。您从哪里得到4？

— dumbledad 2015年

“如果您使用长度为2的一面，那么面积将是值的4倍。”我无法告诉您您要在此处说些什么。我认为您的意思是，如果您使用边的长度表示数据的大小，则将数据值加倍会将面积乘以四。

— David Richerby

大卫-那是我的编辑！拉斐尔（Rafael）的原始帖子说：“如果您使用侧面，则面积将是该值的4倍”。如果您知道一种更好的方法来澄清这一点，请这样做。

— dumbledad

1

塔夫特对此进行了广泛的处理。看到：

可视化的定量信息显示，
构想信息等。

图形完整性的一些原则：

在图形本身的表面上物理测量的数字表示形式，应与表示的数值量成正比

应当使用清晰，详细和彻底的标签来消除图形失真和歧义。在图表本身上写出数据说明。在数据中标记重要事件。

显示数据变化，而不是设计变化。

在货币的时间序列显示中，紧缩和标准化的货币计量单位几乎总是比名义单位好。

所描述的信息携带（可变）维度的数量不应超过数据中的维度数量。图形不得引用上下文之外的数据。

在您的情况下，您必须问自己，是否可以用2D或3D图像或线条更好地表示数据。立方体，正方形和直线不同。这就是3D条形图如此经常引起误解的原因之一。

— 马约
source