通常,用户很想打破轴值以在同一张图上呈现不同数量级的数据(请参阅此处)。尽管这可能很方便,但它并不总是显示数据的首选方式(充其量可能会引起误解)。有几种显示数个数量级不同的数据的替代方法?
我可以想到两种方式,对数转换数据或使用晶格图。还有哪些其他选择?
通常,用户很想打破轴值以在同一张图上呈现不同数量级的数据(请参阅此处)。尽管这可能很方便,但它并不总是显示数据的首选方式(充其量可能会引起误解)。有几种显示数个数量级不同的数据的替代方法?
我可以想到两种方式,对数转换数据或使用晶格图。还有哪些其他选择?
Answers:
我非常警惕在条形图上使用对数轴。问题在于您必须选择轴的起点,而这几乎总是任意的。您可以选择仅通过更改轴上的最小值来使两个钢筋的高度完全不同,或者几乎相同。这三个图形都绘制相同的数据:
不连续轴的一种替代方法(目前还没有人提及)是简单地显示一个值表。在许多情况下,表格比图形更易于理解。
一些其他想法:
(1)您不必将自己局限于对数变换。例如,在此站点上搜索“数据转换”标签。一些数据非常适合某些转换,例如根或logit。(为非技术人员发布图形时,通常应避免这种转换,甚至是日志记录。另一方面,它们可以是查看数据模式的出色工具。)
(2)您可以借用一种标准的制图技术,在图表内部或旁边插入图表的详细信息。具体来说,您可以将极端值自己绘制在一个图表上,而将所有(或其余)数据绘制在另一个轴范围更有限的图表上,然后以图形方式排列两个图表以及关系的指示(可视和/或书面)它们之间。想想美国的地图,其中阿拉斯加和夏威夷的比例不同。(这不适用于所有类型的图表,但可能对插图中的条形图有效。)[我看这与mbq的最新答案类似。]
(3)您可以在不间断轴上并排显示断面图和相同的图。
(4)在您的条形图示例中,选择合适的(可能是拉伸得很长的)垂直轴并提供一个平移实用程序。[比起真正有用的技术恕我直言,这更多的是技巧,但在某些特殊情况下可能有用。]
(5)选择其他模式以显示数据。例如,可以选择使用符号区域表示值的图表,而不是使用长度来表示值的条形图。[显然这里涉及折衷。]
您对技术的选择可能取决于情节的目的:例如,为数据探索而创建的情节通常不同于普通受众的情节。
也许可以将其归类为晶格,但我会尝试;在一个面板中绘制所有缩放到最高比例的条形图,然后在另一面板上显示缩放比例的条形图。如果发生散点图,我曾经使用过这种技术,结果非常不错。
我将对数轴问题与条形图问题分开了。
对数轴恕我直言最适合以倍数出现或发生的事情(...用...处理时增加20倍)。
在这种情况下,1 =10⁰是自然起源。实际上,有一个完整的物理/化学值范围是对数的,例如pH或吸光度,并且具有“自然”起源。对于A,那将是。对于水溶液的pH值,例如7。
如果没有明智且固定的起点充当控件(基线,空白),则条形图永远不会明智。但这与对数轴没有任何关系。
我对条形图的唯一常规用法是直方图。但是我可以想象它们很好地证明了与原产地的差异(您还可以立即看到差异是正的还是负的)。因为条形图表示一个区域,所以我倾向于将条形图视为曲线下面积的非常离散的版本。也就是说,x轴应具有度量含义(时间可能会这样,但城市可能不会这样)。
如果我发现自己想知道将“自然”原点设为0的东西的原木用于记录,我会退后一步,对正在发生的事情进行一些思考。通常,此类问题仅表示日志不是明智的转换。
现在,带有对数轴的条形图将强调以倍数出现的增加或减少。我现在可以想到的明智的例子都与利息价值具有线性关系。但是也许其他人找到了一个很好的例子。
因此,我认为就手头数据的意义而言,数据转换应该是明智的。上面提到的理化单位I就是这种情况(A与浓度成正比,pH值与pH计中的电压呈线性关系)。实际上,在很多情况下,日志单元会获得一个新名称,并以线性方式使用。
最后但并非最不重要的一点是,我来自振动光谱学,经常使用断轴。而且我认为这种用法是轴断裂不构成欺骗的少数示例之一。但是,我们没有数量级的变化。我们仅有x范围的30%至40%的
无效区域:这是一个示例:
对于此示例,1800-2800 / cm之间的部分不能包含任何有用的信息。
因此,取消了无效的光谱范围(这也表明我们实际用于化学计量学建模的光谱范围):
但是,为了解释数据,我们需要精确读取x位置。但是通常我们不需要跨越不同范围的倍数(即存在这种关系,但是大多数连接都更复杂。例如:信号为3050 / cm,因此我们具有不饱和或芳香物质。但是在1000 / cm处没有强信号,因此没有单,间或1,3,5-取代的芳环...)
因此,最好以更大的比例来描绘x(实际上,我们经常使用毫米片状的指南或标记确切的位置)。因此,我们断开了轴,并获得了更大的x缩放比例:
实际上,它非常类似于刻面:
但是断断续续
的轴IMHO强调两个部分中x轴的比例是相同的。即,绘制区域内的间隔是相同的。
为了强调小强度(y轴),我们使用放大插图:
[ ...有关详情,请参阅放大(×20)νCH在蓝色区域.... ]
当然,通过链接图中的示例也可以做到这一点。
当我查看出色的答案和评论时,提到但未明确描述的两个想法是,您正在使用条形图“与标签不一致”和标准化/无量纲的数据。
星形/蜘蛛/雷达样式的图表(链接)(链接)通常非常适合沿多个坐标比较多个不同的事物。有很多非常有用的图表在商务演示中很少见,这很可能是因为领导者更喜欢使用结论来制定决策,而不是使用信息来获得理解,然后使用理解来做出决策。在业务中,有时很难建立共识,因此仅结果优先的方法可以在共识优先,决策后的环境中获得更高的收益。这通知了条形/柱形图的受欢迎程度。请考虑其他有助于理解的图形类型的示例(链接)。
如果将制图的值除以“特征”值,则可以转换缩放比例以提高可读性而不会丢失信息。流体动力学家更喜欢无量纲数字,因为它们具有预测效用和应用弹性。他们将诸如白金汉Pi定理之类的东西视为候选无量纲形式的源(链接)。流行且有用的无量纲数包括雷诺数,马赫数,比奥数,Grashof数,Pi,罗利数,斯托克斯数和舍伍德数。(链接) 您不必是物理学家就可以爱无量纲的数字,因为它们在非物理应用中很有用。诸如密度,同质性,圆形度和共面性之类的度量可以定义图像,像素场或多元概率分布。不要只是考虑对数或与已知值的相对距离,还可以考虑将数字取反,取其平方根。
祝你好运。请让我们知道结果如何。