对数刻度何时合适?


57

我已经读过,在某些情况下(例如时间序列图中的y轴),在作图/作图时使用对数刻度是合适的。但是,我无法找到关于为何如此或何时合适的明确解释。请记住,我不是统计学家,所以我可能会完全忘记这一点,如果是这种情况,我将感谢提供补救资源的方向。


10
这不是一个正式的答案,但是-当一个变量跨越几个数量级时,通常更容易在眼睛上看到(并且提供更多信息)以对数刻度可视化它。
2012年

宏-很有道理(尤其是当您有能够理解它的受众!)
dav

1
在等待特定答复时,您可能会发现此密切相关的使用线程:stats.stackexchange.com/questions/298。在图表方面,您可以将“因变量”有效地解释为“ y轴”。然后看看这里出现的许多密切相关的问题
ub

3
此外,FYI Naomi Robbins在该主题上也有一篇非常简单的文章,应该引起关注,我何时应该在我的图表中使用对数刻度?
安迪W

Whuber,感谢您指出额外的链接。我看过其中一些,但不是全部,现在我正在研究它们。
dav 2012年

Answers:


51

这是一个非常有趣的问题,很少有人想到。对数刻度可以采用几种不同的方法。第一个也是最著名的是Macro在他的评论中提到的:对数刻度允许显示较大的范围,而不会将较小的值压缩到图形的底部。

选择对数缩放的另一个原因是在更自然地以几何方式表示数据的情况下。一个例子是数据代表生物介质的浓度。浓度不能为负,并且变异性几乎总是与均值成比例(即存在异方差)。使用对数标度,或者等效地,使用对数浓度作为主要标准,该度量既“固定”了不均匀变异性,又给出了两端无界的标度。浓度可能呈对数正态分布,因此对数缩放为我们提供了非常方便的结果,可以说是“自然的”。在药理学中,我们经常使用对数刻度来表示药物浓度,

对数刻度的另一个很好的原因,也许是您对时序数据感兴趣的一个原因,是对数刻度使分数变化等效的能力。想象一下您的退休投资的长期表现。它应该(应该)呈指数增长,因为明天的兴趣取决于今天的投资(大致而言)。因此,即使以百分比表示的绩效相当稳定,在右侧图表中的资金增长也似乎是最快的。对于对数刻度,恒定的百分比变化被视为恒定的垂直距离,因此恒定的增长率被视为直线。这通常是一个很大的优势。

选择对数刻度的另一个更为深奥的原因是可以合理地将值表示为x或1 / x的情况。我自己的研究中的一个例子是血管阻力,也可以合理地表示为相互的血管电导。(在某些情况下,将血管的直径视为抵抗力或电导的力量是明智的。)这些措施中没有一个比另一个更现实,在研究论文中都可以找到。如果将它们按对数进行缩放,则它们只是彼此为负,选择一个或另一个不会产生任何明显的差异。(当所有直径均按对数比例缩放时,血管直径将与电阻和电导相差一个常数乘数。)


感谢您的出色回答!不过,您能否详细说明“值可以合理地表示为x”?
ktdrv

4
@ktdrv有些事情有道理。假设您要记录渔夫的能力。您可以计算每天捕获的鱼的数量,也可以测量连续捕获之间的间隔。任一种测量都是有意义的,但是它们彼此之间是非线性的。它们彼此成比例倒数,因此可以一对一转换。间隔的对数和每天的对数彼此线性相关,并且相差一个常数(负)。
迈克尔·卢

1
迈克尔,谢谢您的出色回答。我不得不承认,花了我一段时间才筛选出所有要点(并且不得不用Google搜索一些术语,例如“异方差”)。我仍在拼凑答案的真正影响将对我的工作产生什么真正的影响,但是我很感激总的方向和指导方针。
DAV

x1/xlog(x)x1/x x1/xx1/x

pH=log[H+]

29

除了@Michael Lew的很好回答之外,我还不得不举一些现实生活中的例子。

首先,下面的两个时间序列图显示了新西兰统计局提供的每月访客到新西兰的次数。这两个图都有其目的,但是我发现垂直轴为对数刻度的图比第一个图具有更多用途。例如,您可以看到到达的季节性与到达的规模大致成比例;您会看到增长率的重大变化(例如在第二次世界大战期间),而这些变化在原始规模上是看不见的。

在此处输入图片说明

其次,以下图表显示了与实际在新西兰的游客相比,新西兰游客的旅行相关总支出。资料来源是经济发展部的国际游客调查。差额是出行前的支出,例如预先支付的旅馆或套票。除了原始数据(非常重要)印象被分组在左下角之外,原始比例的第一幅图可用于其他目的。第二个图牺牲了一些即时的可解释性,尤其是对于非统计学家(因此,我现在通常实际上在轴上使用对数刻度,而不是变换数据并让刻度显示对数值),但是给出了很多更具视觉差异。

例如,您可以清楚地发现总支出少于新西兰支出的几个离群值(事实证明是数据编辑错误)。也许更重要的是,您可以使用此图使用不同的颜色或多面来显示不同的市场国家或访问目的(例如,假日诉探访朋友和家人)如何占用支出“空间”的不同部分-这是看不见的在原始轴上。

将此图变成有用的东西将涉及处理高密度数据(例如,通过对点添加一些透明度,或将点替换为根据密度着色的六边形框),但是任何有用的视觉解决方案几乎都肯定会涉及对数轴。

在此处输入图片说明

编辑/添加

另一幅图说明了我的六角形垃圾箱的含义,当有大量数据集时,用颜色表示密度(在这种情况下,约有12000名受访者参加了有关新西兰橄榄球世界杯经历的调查)。再次注意,这是另一个示例,其中我使用了对数标度来表示支出。

在此处输入图片说明


彼得,感谢您的附加见解-图形确实有助于理解您的观点。一个后续问题(如果您有这样的倾向),为什么要用“六角形”垃圾箱替换点?这和“向日葵图”是一样的想法吗?我以前没听过这个词。
dav

不,与向日葵地块不同。重点是将绘图区域划分为六边形仓,然后根据每个仓中有多少个点为它们着色(例如,从浅到深)。这可能是避开绘制大型数据集的好方法,否则这些数据集可能会变成大量黑色。
彼得·埃利斯

@DavidVandenbos -我添加了一个例子
彼得·埃利斯

(评论的其余部分)@PeterEllis感谢您的澄清。这是一种可视化数据的好方法-与我使用的地理热图非常相似。您是在R中创建的吗?
DAV

是的,R,使用ggplot2软件包-非常有用,一旦您掌握了基础知识,就非常简单。
彼得·埃利斯

9

关于对数刻度的另一妙事是它们使比率显得对称。例如,像这样: 在此处输入图片说明


9
为了进行比较,很高兴能看到同一比例的线性图表
nico
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.