您如何在choropleth映射上选择分类?


11

我发现自己在显示Choropleth(又称主题)地图以供他人查看时,越来越难以定义断点。是否有人建议参考,如何选择所用秤的类型以及合适的断点数量?特别是对于箱的数量,我只看过有限数量的参数(例如,不应使用超过5个)。


为了更具体地寻找我要寻找的内容,我所遇到的关于该主题的大多数参考文献都与julien在本帖子中参考的文档相似,我只是在寻找关于该主题的更深入的讨论。

我经常遇到一些特定的用例(例如我的奋斗示例);

  • 当显示具有较大右偏的数据时,我通常不愿显示指数比例。我担心(对于我通常向其显示地图的受众),这会导致阅读比例尺并将实际属性值映射到颜色时产生大量的认知负担。我的担心不正确吗?同样对于这些类型的分布,我发现很难证明任何特定数量的垃圾箱是合理的。
  • 在显示许多小倍数地图时,如何选择合适的比例以使人可以有效地可视化小倍数内部和之间的关系?当属性比例变化很大时,我的实际标准是在每个单独的分布内使用五分位数。五分位数的分类过多,是否造成太多的认知负担,无法在面板之间进行比较?我假设人们理解分位数的分类等同于排名(因此,以这种方式分类有助于在面板之间进行解释),这种假设是否正确?

我最初写了一段段落来描述这些地图的目标,但我怀疑我的目标很典型,因此不需要。唯一需要再次澄清的是,这些内容仅供其他人查看(例如在报告,出版物中),而不是真正用于我自己的探索性数据分析(尽管我怀疑好的建议应该转换为两者之一)。也许很好的参考可以描述此类地图的潜在目标,以及与使用不同分类方案相关的权衡。我将对特定的参考文献和一般的参考文献都感兴趣。


3
虽然不是答案,但这更多是一个概念。我刚刚读了一篇文章,该文章提到“ 5秒规则”,但它也应适用于地图。“ ...将[地图]放到屏幕上,五秒钟后将其删除,然后要求观看者描述[地图]。密集的[地图]无法通过测试,并且无法提供任何视觉效果的基本功能:以帮助演示。” forbes.com/sites/jerryweissman/2011/10/26/…–
RyanKDalton

@RyanDalton,这个想法绝对与讨论有关,我怀疑5秒钟的测试与人们进行统计图形解释实验的方式没有太大不同。我希望我不必开始进行实验就可以弄清楚如何制定分类方案!请注意,在我非常熟悉所显示的数据之后,我不确定如何对自己进行5秒钟的测试。
安迪W

2
@Ryan“ 5秒规则”有助于解释为什么这么多演示文稿显得如此愚蠢和平淡。基本上是在说:“不敢展示任何足够丰富和有趣的东西,以至于它实际上可能会引起观众的注意并吸引他们。” 确实,Beautiful Maps线程中的每个示例都会使该测试“失败”。假设地图构造良好,并解释,或许没有这个测试是一个东西!
whuber

Answers:


6

Alan M. McEachren撰写的《地图的运作方式》(吉尔福德出版社,1995/2004)是一本很好的参考书,但引用不足。它不是快速指南,而是基于令人印象深刻的科学调查和从业人员的知识,全面回顾了地图的显示和理解方式。


1
昨晚刚开始阅读时效果很好!最近,我在ColorBrewer在线应用程序中遇到了这篇论文(Harrower和Brewer,2003年),其中建议McEachren书选择分类数。除此之外,我在《如何与地图撒谎》中发现Monmonier 讨论了不合逻辑的数字/配色方案。没有我在那儿寻求的论据那么详尽,但比我到目前为止发现的任何事物都更详尽。我将浏览McEachren中的相关部分,以了解它是否满足我的好奇心。
Andy

2
您也可以查看TA Slocum撰写的“专题制图和可视化”(Prentice Hall,1999年)。年龄稍大,但他是GF Jenks的学生,我发现这本书非常易读且直接有用。它有一整章关于分类,并举例说明了McEachren地图复杂性指数。
LaurentJégou'1

4

我最近购买了专题制图和可视化Slocum等,2005),只是略读它似乎已经足够满足我对选择垃圾箱的一般参考。当然,这将使我有足够的阅读时间,而且购买的决定也不是一件艰巨的决定(有很多较便宜的旧书在附近徘徊)。

请注意,我认为我不会特别推荐MacEachren的“地图的工作原理 ”。这本书实在是太庞大了,我可能已经忘记了,但是我不记得任何关于选择垃圾箱数量的简单讨论(至少不像Slocum教科书中专门讨论该章节的书那么简单)。如果我想我还记得他提到的话题有点过头了,还没有得出任何真正的结论,但是无论如何我肯定会推荐它作为数据可视化的一般参考。

关于该主题的文献非常多,我将不得不做更多的自学研究,以查看是否可以为偏斜分布的分类提出更令人满意的答案。如果我还有更多要说的话,我会回发。

但是,关于第二个关于可视化小型多张地图的问题,我最近遇到了Cynthia Brewer和Linda Pickle撰写的一篇文章,《对在Choropleth地图上对流行病学数据进行系列分类的方法的评估》(PDF 此处),这正是针对我的问题。

简而言之,有实验表明,分位数是表示一系列小的多重图的最有用的方法,这既便于解释(正如我在问题中所建议的),又是当多边形产生填充时,它们产生相等面积的图。大小大致相同。在您看到一个反例之前,这也许并不明显,下面我粘贴了一些小的多重图,其中在一系列不同的癌症发生率上,分类被限制为相等(在引用的文章的第674页上)。

在此处输入图片说明

由于肝脏疾病的发生率远低于COPD,因此顶部地图中的所有县都倾向于属于较低的类别。如果您无法区分其中一张地图中的图案,则不太可能在地图之间区分开图案!当然,如果合理,应该使分类保持一致,但这仅对某些比较图而言是合理的。至于实验中选择的7个垃圾箱数量。


-1

看到这个参考。优化许多Choropleth映射类的选择

T.Bandrova等。(编),《社会主题制图学》,《地理信息和制图学讲义》,DOI:10.1007 / 978-3-319-08180-9_6,瑞士施普林格国际出版公司,2014年


2
该参考文献可能很相关,但是您是否可以至少写一段总结其内容的段落,以帮助任何人阅读您的答案,以确定是否值得尝试查找它?
PolyGeo
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.