1
如何确定图的y轴是否应从零开始?
一种“依靠数据说谎”的常见方法是使用y轴刻度,使看起来好像变化比实际变化更重要。 当我审阅科学出版物或学生的实验报告时,我常常对这种“数据可视化的罪过”感到沮丧(我相信作者无意间犯了这个错误,但仍然会引起误导。) 但是,“始终将y轴从零开始”并不是一成不变的规则。例如,爱德华·塔夫特(Edward Tufte)指出,在时间序列中,基线不一定为零: 通常,在时间序列中,使用显示数据而不是零点的基线。如果在绘制数据时出现零点,则很好。但是,不要花很多空的垂直空间试图降低到零点,而要隐藏数据线本身中发生的事情。(这本书“如何用统计说谎”在这一点上是错误的。) 例如,在整个时间序列中都没有零点的地方,可以看看任何主要的科学研究出版物。科学家们希望展示他们的数据,而不是零。 对数据进行上下文化的冲动是一个很好的冲动,但是上下文并不是来自空的垂直空间下降到零,这一数字甚至在很多数据集中都不会出现。相反,对于上下文,水平显示更多数据! 我想指出我撰写的论文中的误导性陈述,但我不想成为零Y轴纯粹主义者。 是否有任何准则可解决何时将y轴从零开始以及何时不必要和/或不合适的情况?(尤其是在学术工作中。)