断轴有哪些替代方法?


28

通常,用户很想打破轴值以在同一张图上呈现不同数量级的数据(请参阅此处)。尽管这可能很方便,但它并不总是显示数据的首选方式(充其量可能会引起误解)。有几种显示数个数量级不同的数据的替代方法?

我可以想到两种方式,对数转换数据或使用晶格图。还有哪些其他选择?


1
这些Excel指南看起来很诡异...

5
您能想象一个R的教程对一个从未见过任何代码的人的印象吗?:)
RomanLuštrik2010年

3
好的,但是我也可以想象所有这些人都在Excel中手动绘制多个小节,并相信这是唯一(因此最简单,最快)的方法。或者人们花费数小时试图统一大型Word文档中的格式。

1
“父亲,请原谅他们,因为他们不知道自己在做什么。” 浮现在脑海。:)
RomanLuštrik2010年

3
stats.stackexchange.com的官方乐队:破碎之斧。
马特·帕克

Answers:


17

我非常警惕在条形图上使用对数轴。问题在于您必须选择轴的起点,而这几乎总是任意的。您可以选择仅通过更改轴上的最小值来使两个钢筋的高度完全不同,或者几乎相同。这三个图形都绘制相同的数据: alt text

不连续轴的一种替代方法(目前还没有人提及)是简单地显示一个值表。在许多情况下,表格比图形更易于理解。


3
这些图看起来也很诱人,因为您上面没有错误栏。如果添加误差线,差异将显得不那么重要。或者,您可以使用箱须图来避免此类问题。
nico

5
恕我直言,原点是条形图的问题,与对数无关。您可以使用线性轴达到相同的欺骗效果。
cbeleites支持Monica

@cbeleites。是的,您可以通过更改基线来创建具有线性轴的误导条形图。但是对于线性轴,自然基线为零。在大多数情况下,使用对数轴时,没有自然基线。
Harvey Motulsky

@HarveyMotulsky:我不同意。有一类完整的数据可以用对数轴很好地描述,并且具有自然的基线:乘性变化/比率。在您的示例中,可能处理后的信号是控制信号的15倍。如果该假设对应用程序确实有意义,则您的日志具有“自然”基线。如果没有,也许再进行一次转换更明智?
cbeleites支持Monica

1
@cbeleites我同意,如果变量是比率,那么1.0是自然基线,那么以对数刻度显示它是有意义的。
Harvey Motulsky

11

一些其他想法:

(1)您不必将自己局限于对数变换。例如,在此站点上搜索“数据转换”标签。一些数据非常适合某些转换,例如根或logit。(为非技术人员发布图形时,通常应避免这种转换,甚至是日志记录。另一方面,它们可以是查看数据模式的出色工具。)

(2)您可以借用一种标准的制图技术,在图表内部或旁边插入图表的详细信息。具体来说,您可以将极端值自己绘制在一个图表上,而将所有(或其余)数据绘制在另一个轴范围更有限的图表上,然后以图形方式排列两个图表以及关系的指示(可视和/或书面)它们之间。想想美国的地图,其中阿拉斯加和夏威夷的比例不同。(这不适用于所有类型的图表,但可能对插图中的条形图有效。)[我看这与mbq的最新答案类似。]

(3)您可以在不间断轴上并排显示断面图和相同的图。

(4)在您的条形图示例中,选择合适的(可能是拉伸得很长的)垂直轴并提供一个平移实用程序。[比起真正有用的技术恕我直言,这更多的是技巧,但在某些特殊情况下可能有用。]

(5)选择其他模式以显示数据。例如,可以选择使用符号区域表示值的图表,而不是使用长度来表示值的条形图。[显然这里涉及折衷。]

您对技术的选择可能取决于情节的目的:例如,为数据探索而创建的情节通常不同于普通受众的情节。


8

也许可以将其归类为晶格,但我会尝试;在一个面板中绘制所有缩放到最高比例的条形图,然后在另一面板上显示缩放比例的条形图。如果发生散点图,我曾经使用过这种技术,结果非常不错。


8

我将对数轴问题与条形图问题分开了。

对数轴恕我直言最适合以倍数出现或发生的事情(...用...处理时增加20倍)。
在这种情况下,1 =10⁰是自然起源。实际上,有一个完整的物理/化学值范围是对数的,例如pH或吸光度一种=G一世0-G一世,并且具有“自然”起源。对于A,那将是一世0。对于水溶液的pH值,例如7。

如果没有明智且固定的起点充当控件(基线,空白),则条形图永远不会明智。但这与对数轴没有任何关系。
我对条形图的唯一常规用法是直方图。但是我可以想象它们很好地证明了与原产地的差异(您还可以立即看到差异是正的还是负的)。因为条形图表示一个区域,所以我倾向于将条形图视为曲线下面积的非常离散的版本。也就是说,x轴应具有度量含义(时间可能会这样,但城市可能不会这样)。

如果我发现自己想知道将“自然”原点设为0的东西的原木用于记录,我会退后一步,对正在发生的事情进行一些思考。通常,此类问题仅表示日志不是明智的转换。

现在,带有对数轴条形图将强调以倍数出现的增加或减少。我现在可以想到的明智的例子都与利息价值具有线性关系。但是也许其他人找到了一个很好的例子。

因此,我认为就手头数据的意义而言,数据转换应该是明智的。上面提到的理化单位I就是这种情况(A与浓度成正比,pH值与pH计中的电压呈线性关系)。实际上,在很多情况下,日志单元会获得一个新名称,并以线性方式使用。

最后但并非最不重要的一点是,我来自振动光谱学,经常使用断轴。而且我认为这种用法是轴断裂不构成欺骗的少数示例之一。但是,我们没有数量级的变化。我们仅有x范围的30%至40%的spectrum 无效区域:这是一个示例: 对于此示例,1800-2800 / cm之间的部分不能包含任何有用的信息。
因此,取消了无效的光谱范围(这也表明我们实际用于化学计量学建模的光谱范围): spectrum uninformative part removed

但是,为了解释数据,我们需要精确读取x位置。但是通常我们不需要跨越不同范围的倍数(即存在这种关系,但是大多数连接都更复杂。例如:信号为3050 / cm,因此我们具有不饱和或芳香物质。但是在1000 / cm处没有强信号,因此没有单,间或1,3,5-取代的芳环...)
因此,最好以更大的比例来描绘x(实际上,我们经常使用毫米片状的指南或标记确切的位置)。因此,我们断开了轴,并获得了更大的x缩放比例: spectrum - broken axis

实际上,它非常类似于刻面:facetted version
但是断断续续 的轴IMHO强调两个部分中x轴的比例是相同的。即,绘制区域内的间隔是相同的。

为了强调小强度(y轴),我们使用放大插图:
enter image description here
[ ...有关详情,请参阅放大(×20)νCH在蓝色区域.... ]

当然,通过链接图中的示例也可以做到这一点。


2

当我查看出色的答案和评论时,提到但未明确描述的两个想法是,您正在使用条形图“与标签不一致”和标准化/无量纲的数据。

地块类型:

星形/蜘蛛/雷达样式的图表(链接)(链接)通常非常适合沿多个坐标比较多个不同的事物。有很多非常有用的图表在商务演示中很少见,这很可能是因为领导者更喜欢使用结论来制定决策,而不是使用信息来获得理解,然后使用理解来做出决策。在业务中,有时很难建立共识,因此仅结果优先的方法可以在共识优先,决策后的环境中获得更高的收益。这通知了条形/柱形图的受欢迎程度。请考虑其他有助于理解的图形类型的示例(链接)

转型:

如果将制图的值除以“特征”值,则可以转换缩放比例以提高可读性而不会丢失信息。流体动力学家更喜欢无量纲数字,因为它们具有预测效用和应用弹性。他们将诸如白金汉Pi定理之类的东西视为候选无量纲形式的源(链接)。流行且有用的无量纲数包括雷诺数,马赫数,比奥数,Grashof数,Pi,罗利数,斯托克斯数和舍伍德数。(链接) 您不必是物理学家就可以爱无量纲的数字,因为它们在非物理应用中很有用。诸如密度,同质性,圆形度和共面性之类的度量可以定义图像,像素场或多元概率分布。不要只是考虑对数或与已知值的相对距离,还可以考虑将数字取反,取其平方根。

祝你好运。请让我们知道结果如何。


1
大多数数据即权威机构都强烈反对使用雷达图。他们很难解释。更好的替代方法是平行坐标图
乔恩·

@JonPeltier-我同意,但是Excel(在我回答时)没有一种干净的方法来制作平行坐标图,因此他的听众很可能难以理解。
EngrStudent-恢复莫妮卡

1

当整个图上有明显的断点并标出纵坐标以使间隙明显时,折断轴解决方案最有效。这样做的优点是在两组值之间保留了小数位数。不同比例的面板图可能无法传达低组和高组内的相对变化。我确实喜欢放大图的想法,我为散点图编写了此图,但没有想到将其用于条形图。

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.