我已经读过,在某些情况下(例如时间序列图中的y轴),在作图/作图时使用对数刻度是合适的。但是,我无法找到关于为何如此或何时合适的明确解释。请记住,我不是统计学家,所以我可能会完全忘记这一点,如果是这种情况,我将感谢提供补救资源的方向。
我已经读过,在某些情况下(例如时间序列图中的y轴),在作图/作图时使用对数刻度是合适的。但是,我无法找到关于为何如此或何时合适的明确解释。请记住,我不是统计学家,所以我可能会完全忘记这一点,如果是这种情况,我将感谢提供补救资源的方向。
Answers:
这是一个非常有趣的问题,很少有人想到。对数刻度可以采用几种不同的方法。第一个也是最著名的是Macro在他的评论中提到的:对数刻度允许显示较大的范围,而不会将较小的值压缩到图形的底部。
选择对数缩放的另一个原因是在更自然地以几何方式表示数据的情况下。一个例子是数据代表生物介质的浓度。浓度不能为负,并且变异性几乎总是与均值成比例(即存在异方差)。使用对数标度,或者等效地,使用对数浓度作为主要标准,该度量既“固定”了不均匀变异性,又给出了两端无界的标度。浓度可能呈对数正态分布,因此对数缩放为我们提供了非常方便的结果,可以说是“自然的”。在药理学中,我们经常使用对数刻度来表示药物浓度,
对数刻度的另一个很好的原因,也许是您对时序数据感兴趣的一个原因,是对数刻度使分数变化等效的能力。想象一下您的退休投资的长期表现。它应该(应该)呈指数增长,因为明天的兴趣取决于今天的投资(大致而言)。因此,即使以百分比表示的绩效相当稳定,在右侧图表中的资金增长也似乎是最快的。对于对数刻度,恒定的百分比变化被视为恒定的垂直距离,因此恒定的增长率被视为直线。这通常是一个很大的优势。
选择对数刻度的另一个更为深奥的原因是可以合理地将值表示为x或1 / x的情况。我自己的研究中的一个例子是血管阻力,也可以合理地表示为相互的血管电导。(在某些情况下,将血管的直径视为抵抗力或电导的力量是明智的。)这些措施中没有一个比另一个更现实,在研究论文中都可以找到。如果将它们按对数进行缩放,则它们只是彼此为负,选择一个或另一个不会产生任何明显的差异。(当所有直径均按对数比例缩放时,血管直径将与电阻和电导相差一个常数乘数。)
除了@Michael Lew的很好回答之外,我还不得不举一些现实生活中的例子。
首先,下面的两个时间序列图显示了新西兰统计局提供的每月访客到新西兰的次数。这两个图都有其目的,但是我发现垂直轴为对数刻度的图比第一个图具有更多用途。例如,您可以看到到达的季节性与到达的规模大致成比例;您会看到增长率的重大变化(例如在第二次世界大战期间),而这些变化在原始规模上是看不见的。
其次,以下图表显示了与实际在新西兰的游客相比,新西兰游客的旅行相关总支出。资料来源是经济发展部的国际游客调查。差额是出行前的支出,例如预先支付的旅馆或套票。除了原始数据(非常重要)印象被分组在左下角之外,原始比例的第一幅图可用于其他目的。第二个图牺牲了一些即时的可解释性,尤其是对于非统计学家(因此,我现在通常实际上在轴上使用对数刻度,而不是变换数据并让刻度显示对数值),但是给出了很多更具视觉差异。
例如,您可以清楚地发现总支出少于新西兰支出的几个离群值(事实证明是数据编辑错误)。也许更重要的是,您可以使用此图使用不同的颜色或多面来显示不同的市场国家或访问目的(例如,假日诉探访朋友和家人)如何占用支出“空间”的不同部分-这是看不见的在原始轴上。
将此图变成有用的东西将涉及处理高密度数据(例如,通过对点添加一些透明度,或将点替换为根据密度着色的六边形框),但是任何有用的视觉解决方案几乎都肯定会涉及对数轴。
编辑/添加
另一幅图说明了我的六角形垃圾箱的含义,当有大量数据集时,用颜色表示密度(在这种情况下,约有12000名受访者参加了有关新西兰橄榄球世界杯经历的调查)。再次注意,这是另一个示例,其中我使用了对数标度来表示支出。