如何制作好的色彩强度标尺?


12

我的统计数据绝对不是很好,但我认为我来对地方了。我的问题很简单:

我的问题是比较一个小国家中几个州的人口,但是有些州的人口是30万,有些州的人口是2000。
我正在将其绘制在地图上,颜色的“强度”取决于每个州的人口与整个国家的人口比较。

问题在于,人口众多的州用非常强烈的颜色显示,而小州几乎没有任何颜色。

有没有一种简单的方法可以“标准化”或使数据具有可比性?

我不知道自己是否在正确地解释自己,但我希望有人能帮助我。如果我的问题不清楚,请发表评论,我会澄清。

谢谢您的帮助!


4
我建议您在gis堆栈交换站点上查看可视化标记,例如gis.stackexchange.com/questions/tagged/visualisation
Andy W

1
同样,您可能希望在www.0to255.com上查看渐变。
皮特·威尔逊

R的某些地图包具有内置的颜色代码,可以防止此类问题,但这是否是您要问的问题?
神父

我在自定义地图上使用此颜色,一种明显的方法(将每个值除以总人口数)的确为我提供了0到1之间的值(然后我使用该值选择颜色的“强度”)。问题在于,有些值的适用性过高,因此某些州看上去完全是彩色的,而有些州几乎根本没有颜色。从统计学上讲,我知道这是正确的,但是我想使数据表示更相关且更易于理解。
Zebs 2011年

为什么要使用统一休息时间?为什么不使用对数刻度?或者,也许在您的应用程序中,您可以选择具有一定意义的断点(例如,农村/郊区/城市)。
JMS

Answers:


6

对不起,但对我来说,这听起来像是您正在尝试解决未损坏的问题。实际上,您甚至可能试图破坏未破坏的东西。如果您的量化变量(在此是总体)跨越了很宽的范围,那么无论您用来表示它的度量标准是什么,也都应该跨越很宽的范围。

但是对于所有与颜色(和特别是贴图)有关的东西,关键来源是我认为ColorBrewer


2
我试图破坏一些东西;我知道我得到的值在统计上是正确的,但我想让用户更容易理解数据。这是用户界面的决定。
Zebs 2011年

@Zebs:弯曲,更像..
naught101

5

很好的问题,一种解决方案是重新缩放颜色,使它们更均匀地分布,或分布到尾巴较低的分布中……但是您的图例必须足够清楚,因为以某种方式使比例尺变形是不公平的……

例如,在R中,将法线缩放为均布。(由于尾巴大而您希望它们变小,所以您可能会采取其他方法,但是原理是相同的)

X=array(rnorm(10000),c(100,100))
ramp=colorRamp(c("blue","cyan","white","yellow","red"),space ="rgb")
kleur <- rgb( ramp(seq(0,1,length=200)),max = 255)
par(mfrow=c(1,2))
image(X,col=kleur)### image without rescaling
Fn=ecdf(X)
ScaledX=array(Fn(X),c(100,100))
image(ScaledX,col=kleur)

3

您可以除以总人口。这样可以确保所有值都在0到1之间。如果小数位数仍然太分散,请考虑对数小数位数。


2

我问这个问题很尴尬,但是您是否真的致力于使用颜色来描绘数量?有没有办法在每种状态下放置一个代表高度的条形图?

另一种方法可能是显示带有代表地理区域的区域的地图,以及每个州的面积与人口规模成比例的地图-类似于感觉上的人。但这将是一件痛苦的事情-我不知道有什么办法可以自动化(尽管它可能存在)


好的话!
罗宾吉拉德2011年

4
许多地图软件平台具有本文中提到的功能。当涉及地图时,基于属性的失真通常称为制图。参见gis.stackexchange.com/q/7406/751。话虽这么说,在地图上偶然出现的条形图比颜色更容易显示。当条形图不并排时,它们很难进行相对比较,这与色标无关紧要。
Andy W

我同意,在地图上柱形图并非最佳。做到这一点的另一种方法是使栅格变形,例如:viewsoftheworld.net/?p=832。就我个人而言,我经常发现很难破译它们,但根据失真程度的不同,它们可以做得很好。
naught101

1

您陈述的目标:

比较一个小国家中几个州的人口。

您陈述的问题:

由于某些州的人口为30万,有些州的人口为2000。有没有一种简单的方法可以“标准化”或使数据具有可比性?

旨在在映射之前规范化数据

由于我不确定您制作地图的背景,因此将缺少此答案。

尽管如此,还是有一些想法可以探索:对数据进行规范化,以便地图为潜在的读者提供有趣的含义,以便他们可以将在地图上看到的内容与他们通常想到的某些概念相关联。基本上,我认为您的新归一化数字应该与地图读者感兴趣的定性概念相关联(随机花样:度量=数量x质量,黑格尔)。

两种标准化数据的方法

1.以便了解每个状态中有多少开放空间。

通过计算人口除以州总面积,为人口密度创建一个新的状态变量。

2.为了使状态的着色彼此形成对比。

通过计算与每个状态平均值的偏差来创建新的状态变量。例如,假设您有3个州,其人口如下:

  • 状态A为100。
  • 状态B为50。
  • 状态C为1。

平均约为50。

每个状态的新变量的值如下:

  • 状态A为+50(深绿色)。
  • 状态B为0(灰色)。
  • 状态C为-49(深红色)。

您可以使用正数与负数形成对比的任何配色方案(有关许多地图配色方案的示例,请使用Google'colorbrewer')。

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.