对离散数据使用折线图是否错误?


12

我经常看到离散数据集绘制为线图,但是在我看来,该线会在测量间隔之间的某个点推断出一个值,这对于离散数据集是没有意义的。因此,对离散数据使用折线图是否错误?

例如,以两个时间序列数据集为例,一个是连续的(我的体重,每天早晨测量),另一个是离散的(我每天吃的甜甜圈的数量)。将第一个数据集作为线形图是有意义的,因为可以合理地推断出在任何给定的下午我的体重将与前一天和之后的早上的体重有关。但是,如果将甜甜圈的数量表示为线图,则点之间的线将无法从该线中推断出含义。

编辑

再举一例:联邦小时最低工资自成立以来,在情节http://mste.illinois.edu/courses/ci330ms/youtsey/lineinfo.html

除非我没有记错,否则最低工资变动是离散的,因此不可能查找一些任意选择的时间,并使用将点互连的线在该点确定最低工资。


3
(+1)每小时最低工资的例子很好。您的问题的措辞非常好,它给出了一个很好的答案:即,图上的连接点在导致读者做出不准确(或完全无效)的插值时无效。区分离散性和不连续性将有助于进一步分析:甜甜圈消费是离散的,而最低工资是不连续的。每个都应具有不同的情节形式。
ub

在某些图中,具有离散数据的散点图会误导线图。对于需要一系列事件(磁滞)或在两个级别之间发生振荡并且需要跟踪状态变化及其位置的示例情况。因此:不要使用折线图来暗示插值,而是在适当时使用它们作为指导。建立简单的选择规则还不够简单,但需要考虑手头的数据和模型。
wirrbel 2014年

1
有趣的问题!感谢那。我正在处理许多与时间相关的数据,这些数据部分源于离散模型和部分测量数据。对于离散数据使用阶梯线图(可以以某种方式连续,但在单点之间我们仍然没有功能,不能仅仅假设有一个),而对于连续数据则使用常规线形的选择怎么样?这样的方式,我处理它..
线Kaldemeyer

@CordKaldemeyer感谢您的评论-我不知道图表类型“阶梯线图”,但这绝对是我想要的。我还发现了有关在Excel中进行阶梯线图绘制的有用教程:trumpexcel.com/step-chart-in-excel
user1379351

@ user1379351:很高兴我能帮上忙!
Cord Kaldemeyer

Answers:


9

事实证明,连接线图太有用了,不能局限于单一解释。一些突出的用途:

  • 插值。您提到的情况是,两个变量都是连续的,并且直线上的每个插值点都是有意义的解释。
  • 变化率。即使中间值没有意义,每个线段的斜率也可以很好地表示变化率。请注意,对于这种解释,X和Y值必须适当地隔开,在您引用的工资图中情况并非如此。
  • 资料比较。在比较较小的倍数或重叠量度时,即使对于分类因素,线也是有用的。在这种情况下,这些线用于连接响应组以进行有限的模式识别。这是来自peltiertech.com的示例,标签的可读性在Y轴(而不是X轴)上:

在此处输入图片说明


1
的确如此,但是第二和第三图的功能严格上来说不如第一图,因为一个人根本无法使用微积分。
Milind R

5

好吧,甜甜圈可能与重量有关:-)

虽然我明白了您的观点,但我认为这个示例还不错,因为时间(在水平轴上,即直线所指)是连续的。对我而言,这条线的含义不是那么多,每天您每次吃一定数量的甜甜圈,而是每天甜甜圈的数量以某种规律的方式变化。因此,我们可能在生产线上添加类似黄土的平滑剂,这是有道理的。考虑每小时或什至每分钟吃的甜甜圈至少是合理的(尽管对于每天计数较高的变量,这会更明智)

更令人担忧的是,水平轴是离散的(尤其是标称轴),但是绘制了线条。这真的没有道理。例如,如果您正在观察(说)美国不同地区(例如)居民中对奥巴马的投票率,则在东北和中西部之间划清界限是没有意义的;特别是由于区域的顺序是任意的,但是更改顺序将更改线条。但是我看过这样的图。


1
绝对同意,折线图的滥用情况更为严重。我喜欢更平滑的方法,因为它没有连接点,因此并不意味着数据不存在。但这确实突出了甜甜圈消费令人担忧的趋势。谢谢!
user1379351 2014年

3
您似乎正在提议用另一个变量代替甜甜圈消耗量。即,甜甜圈消耗密度(每单位时间的甜甜圈)。尽管这是经常进行的操作-尤其是在二维分析(例如人口密度图)中,并且可能非常有效,但读者应该意识到存在区别,并考虑如何区别才能很好以图形方式显示。
ub

2
@whuber这是一个公平的观点;该线似乎确实可以替代。不能进行替换的图形可能只是点,没有连接,但这似乎至少暗示了甜甜圈的消耗量位于特定点。因此,我们可以将时间渲染为连续的,并在食用甜甜圈的那一刻画一个点。
彼得·弗洛姆
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.