在印刷地图上有效显示人口统计数据


29

我想在可打印/非交互式地图上绘制以下每个区域(总共30个区域)的数据:

  • 平均年龄
  • 家庭平均收入
  • 户数
  • 人口密度
  • 人数
  • 工人人数

您如何在一张地图上有效显示上述6层?


1
区域相对于页面大小有多大?您可以在每个区域中容纳一小块土地吗?(例如雷达图)
djq 2010年

@celenius-这是一种典型的人口普查调查类型,其中市区要比住宅区小得多,而居民区要比郊区/农村区
小得多

1
静态地图上的这6层是一项艰巨的设计工作。阻止使用交互式地图的问题是什么?
Trevesy

@Trevesy-在大多数情况下,要求是设计一个可打印的地图,突出显示6个​​变量以促进视觉分析
dassouki 2010年

1
我已自由添加可视化标签,如果您认为不合适,请随时删除它。
Andy W

Answers:


20

我要说的是,您不能在一张地图上包含所有数据,并且没有任何意义。我建议您遵循图夫特小倍数原理,考虑到同一区域的多个较小的地图,每个地图使用不同的变量。示例:http//www.juiceanalytics.com/writing/better-know-visualization-small-multiples/

即使那样,您仍然会遇到问题,即使用了一堆不同的单元,因此您需要一堆钥匙。查看数据(而不是在地图中)的另一种方法是使用带有所有值的表,这些值都是彩色的(即-不同颜色表示低于平均值,平均值,高于平均值)

还将建议您查看人口普查地图集以获取更多地图创意:http : //www.census.gov/population/www/cen2000/censusatlas/

可能会帮助您更多地反映您正试图传达的消息(不只是您拥有的数据)。


5
+1这远比通过一次符号化六个变量使混乱变得更好。另外,为什么不打印数据表呢?六列+ id,30行:它足够小,可以提供任何人需要的所有细节。
whuber

13

在一张地图上不可能有效地显示这么多数据。两种可能性:

  • 产生6张地图,

  • 分析数据以对区域进行分类,并显示分类结果。一个主成分分析可以帮助确定您的变量中最重要的关系。此方法已用于生成此合成图:

替代文字

从这些:

替代文字 替代文字


拥有6张地图的问题在于,很难直观地确定任何趋势。有时,查看带有多个变量的地图并了解事物的排列方式非常好
dassouki 2010年

2
@dassouki,要了解事物如何排列,您不一定需要对其进行映射。双变量散点图将满足该标准,并且将更容易解释。
安迪W 2010年

3
拥有6张地图的优点是可以轻松直观地识别趋势!当您尝试将六个(或更多)变量集中到一个映射中时,很难找到模式。(但是,如果该地图涉及数千个功能,我将更改此注释:某些类型的映射,例如字形可视化,可以非常有效地在丰富的多元数据集中查找模式:lmi.bwh.harvard.edu/papers/papers/ KindlmannTVCG2006.html
笨蛋

@julien,很酷的东西,您可能对我刚遇到的这篇文章感兴趣,e-publications.org / ims / submission / index.php / AOAS / user /…,它具有与类似的多变量相关的PCA分析的映射数据以及R代码进行绘图。
安迪W 2010年

真的很有趣,我将不得不阅读有关此内容。
neuhausr 2010年

9

我同意小倍数可能是解决此问题的好方法。为了补充地图,我还建议您使用变量的散点图矩阵,以识别双变量相关性。当您丢失数据的地理方面时,可视化散点图中的变量之间的关系比比较两个地图(甚至并排比较)要简单得多。

如果您仍然希望捕获某种类型的空间趋势,则可以在分布和/或原始变量之间包括空间统计信息(例如局部Moran I)。

编辑:最近,我遇到了一些重新审视由安德烈·米歇尔·居里(Andre-Michel Guerry)(最初于1883年)发表的道德统计的工作,其目的是可视化空间中的多元关系。这些作者的实现与该线程,小倍数,主成分分析,散点图矩阵以及多边形图中的建议非常相似。附件是A.-M的一些图片。 Guerry的法国道德统计:多变量空间分析挑战,作者:Michael Friendly Statistics Science,第1卷。22,第3号。(2007年8月),第368-399页(PDF是免费的)。还有另一篇文章(Dray和Jombart,2010年)分析了相同的数据,并在R中提供了一些源代码来绘制上述图。

一幅图是散点图矩阵,另一幅图是星图(这是表示Pablo建议的条形图的另一种方式)。 替代文字 替代文字


8

这是安德鲁·盖尔曼(Andrew Gelman)(和公司博客)统计建模,因果推论和社会科学上发表的一个小倍数绝妙例子。该地图是各州选民对学校代金券的支持,取决于收入以及各种种族和宗教类别。非白人白人真的不喜欢学校的优惠券!(如果您访问的是真实的博客,尽管该博客出现在2004年的调查数据中,那么他们在该群体中对学校凭证的支持更多)。 在此处输入图片说明


该图很酷,但是色标太可怕了。为什么将50%的优先级设置为灰色?当然应该只使用热图颜色或其他颜色吗?另外,为什么只有白种人分裂成宗教?当然,按种族然后按宗教分开会更有意义吗?
naught101

@ naught101,您的否定使我有些困惑。与光谱任一端的较亮或较暗的颜色相比,肯定可以忽略灰色。尽管我对45%的任意差异不屑一顾,但IMO在制作像这样的小型多重地图时,具有高对比度的值是有益的。国际海事组织对宗教/种族分裂的评论也没有多大意义。这些类别显然与个人是否支持凭证密切相关,而且您建议的某些子集似乎不存在。续...
Andy W

IE我非常怀疑调查中是否存在足够的“黑人天主教徒”,以至于对这样的组织没有实质性的说法(也不是“西班牙非伊万新教徒”),我建议您阅读Gelman的帖子,并希望这会澄清分组
Andy W

也许只是我屏幕上出现了特定的灰色。我认为最好用白色,也许用灰色背景来区分它。同样值得一提的是,盖尔曼博客上的两幅图像的比例各不相同...给我的印象是黑人人口要多得多,但我只是查看了人口普查数据并进行了校正。但奇怪的是,人口普查将西班牙裔的起源定义为与种族正交(这是一个独立的问题)。我猜
盖尔曼

@ naught101这不是人口普查的信息,而是其他调查(人口普查没有任何公众意见)
Andy W

5

要在此处介绍的解决方案之间进行选择,您可以提供两个关键信息:

  • 地图的目的是什么?(发现,公开吗?)
  • 该地图的目标人群是什么?(您,其他分析师,城市规划人员,公众?)

根据目的和公开程度,此处引用的解决方案可能会有不同的效率。

我想通过引用J. Bertin所描述的矩阵对角化技术来概括Julien(一个通过PCA合成的地图)的答案。当人们寻求所有信息的合成而不是完整的数据表示时,它很有用。

简而言之,它包括用直方图表示每个变量,对直方图进行堆叠排序,以使值(地图区域)以对角线方式对齐,从而获得类型:

替代文字

(来源:http : //books.google.com/books?id=2tlQAAAAMAAJ&dq=bertin%20graphique%20information&hl=fr& source= gbs_similarbooks


4

这是很多信息,而且事实是,一张单张地图以主题方式组合所有地图会由于视觉污染而导致无用的呈现。另一方面,有30个区域,因此,每个区域的许多地图也会导致污染。

我的解决方案:选择最重要的信息,例如“家庭收入”,然后按某些收入类别划分地图。最后,针对每个收入点,绘制与其他5个属性的酒吧聊天。

使用该地图可以进行一些比较,例如:“高收入地区总是显示大量工人,平均年龄超过21岁”。

看这个例子...

替代文字


4

也许其中一些想法会有所帮助?

假设您有六个维度:

1:Choropleth:家庭收入示例0

2、3和4:符号:用点表示人数,这可以让您看到背景:示例1, 示例2为工人/非工人使用灰度,并使用不同的配色方案显示年龄

5:3D:使用人口密度作为地形示例3

6 :(我想不出第六种方法!)

显示“家庭数量”,“人口密度”和“人数”是否多余?

如果您拥有除此以外的其他任何人都可以清楚地了解具有如此复杂性的地图,我将表示怀疑。如果我要演示它,那么我将首先分别显示每个元素,然后再添加它,以便观众可以理解这些步骤。


一种替代方法(如果您没有为每个区域留出雷达图的空间,则可以创建一个表示此信息示例4(图10.28)的“字形” 。我认为这些通常很难理解,也不容易设计很明显,但是在这种情况下可以使用链接的示例。


我的另一个想法是将每个多边形的多边形拉伸到相同的高度,然后使用高度的一部分来表示这些参数。类似于为每个区域制作条形图,但每个部分以相似的间隔层叠在顶部。这需要从3D角度进行查看,这意味着其中某些内容将被遮盖。


我爱,我的意思是您的所有建议。我计划实施1-> 4。但是,对于3D东西:我发现当您进行3D地图绘制时,通常位于市中心的市区会获得大部分标高,从而阻挡了许多背后的区域
dassouki 2010年

@dassouki-我同意通常是这种情况。也许您可以使用一个对此范围不大的变量(平均年龄?),或者如果变量不大,则可以对数转换它。
djq 2010年

3
@celenius关于可能的冗余的有趣问题:人口密度是相对于面积的人数。人数是绝对计数;和家庭数量提供有关人们如何生活的信息。尽管这三个变量显然是相关的(并可能在回归中产生近共线性问题),但它们实际上是三个不同的信息。顺便说一句,它是“ choropleth”。(幸运的是,Google识别出这种拼写错误,并且
仍会

1
@whuber-我认为这可能是使用Flash完成的(可悲!)。
djq 2010年

2
我对3D的建议非常怀疑。AFAIK没有人显示3D非常有用。与San Fran犯罪的联系是有效的,但这仅是因为其非常简单-难以破译更复杂的模式。在这种情况下,我认为3D根本不是办法。
Trevesy

2

这是一项艰巨的任务。我的答案是使用多元地图。查看此地图。如果在一张地图上显示所有变量,该地图将显得很忙。如果选择使用多元映射,请确保选择适当的配色方案。


Google文档在我工作的地方被阻止了:(
dassouki 2010年


也不起作用,如果它在末尾没有文件扩展名,我也不会刮
dassouki 2010年

还是不走..
dassouki 2010年

离我这边很远。:(我不介意通过电子邮件向您发送地图
。– Raj

0

一种简化程度是通过制图表达一项,例如人口密度,即扭曲每个单位的面积,使其与人口成比例:

2008年美国总统大选
(来源:amherst.edu

主要缺点是观察者必须能够从其“通常”形状中识别出区域的变形。

此处提供更多信息:http : //gis.amherstma.gov/data/SpringNearc2009/Session4Cartograms.pdf


1
我认为这有潜力,但是目前尚不清楚如何将制图应用于这种特定情况(同时在同一空间查看多个属性)。从理论上讲,您可以制作许多小的多个制图,但可能难以解释(您会丢失地图之间的一致性,这对于小的多个制图而言是必不可少的)。也许可以用更有趣的方式将制图与颜色结合起来以显示多个属性。
Andy W

1
小型多重制图的示例,gisandscience.com / 2011/12/07 /…
Andy W
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.