我的统计数据绝对不是很好,但我认为我来对地方了。我的问题很简单:
我的问题是比较一个小国家中几个州的人口,但是有些州的人口是30万,有些州的人口是2000。
我正在将其绘制在地图上,颜色的“强度”取决于每个州的人口与整个国家的人口比较。
问题在于,人口众多的州用非常强烈的颜色显示,而小州几乎没有任何颜色。
有没有一种简单的方法可以“标准化”或使数据具有可比性?
我不知道自己是否在正确地解释自己,但我希望有人能帮助我。如果我的问题不清楚,请发表评论,我会澄清。
谢谢您的帮助!
我的统计数据绝对不是很好,但我认为我来对地方了。我的问题很简单:
我的问题是比较一个小国家中几个州的人口,但是有些州的人口是30万,有些州的人口是2000。
我正在将其绘制在地图上,颜色的“强度”取决于每个州的人口与整个国家的人口比较。
问题在于,人口众多的州用非常强烈的颜色显示,而小州几乎没有任何颜色。
有没有一种简单的方法可以“标准化”或使数据具有可比性?
我不知道自己是否在正确地解释自己,但我希望有人能帮助我。如果我的问题不清楚,请发表评论,我会澄清。
谢谢您的帮助!
Answers:
对不起,但对我来说,这听起来像是您正在尝试解决未损坏的问题。实际上,您甚至可能试图破坏未破坏的东西。如果您的量化变量(在此是总体)跨越了很宽的范围,那么无论您用来表示它的度量标准是什么,也都应该跨越很宽的范围。
但是对于所有与颜色(和特别是贴图)有关的东西,关键来源是我认为ColorBrewer
很好的问题,一种解决方案是重新缩放颜色,使它们更均匀地分布,或分布到尾巴较低的分布中……但是您的图例必须足够清楚,因为以某种方式使比例尺变形是不公平的……
例如,在R中,将法线缩放为均布。(由于尾巴大而您希望它们变小,所以您可能会采取其他方法,但是原理是相同的)
X=array(rnorm(10000),c(100,100))
ramp=colorRamp(c("blue","cyan","white","yellow","red"),space ="rgb")
kleur <- rgb( ramp(seq(0,1,length=200)),max = 255)
par(mfrow=c(1,2))
image(X,col=kleur)### image without rescaling
Fn=ecdf(X)
ScaledX=array(Fn(X),c(100,100))
image(ScaledX,col=kleur)
我问这个问题很尴尬,但是您是否真的致力于使用颜色来描绘数量?有没有办法在每种状态下放置一个代表高度的条形图?
另一种方法可能是显示带有代表地理区域的区域的地图,以及每个州的面积与人口规模成比例的地图-类似于感觉上的人。但这将是一件痛苦的事情-我不知道有什么办法可以自动化(尽管它可能存在)
您陈述的目标:
比较一个小国家中几个州的人口。
您陈述的问题:
由于某些州的人口为30万,有些州的人口为2000。有没有一种简单的方法可以“标准化”或使数据具有可比性?
由于我不确定您制作地图的背景,因此将缺少此答案。
尽管如此,还是有一些想法可以探索:对数据进行规范化,以便地图为潜在的读者提供有趣的含义,以便他们可以将在地图上看到的内容与他们通常想到的某些概念相关联。基本上,我认为您的新归一化数字应该与地图读者感兴趣的定性概念相关联(随机花样:度量=数量x质量,黑格尔)。
1.以便了解每个状态中有多少开放空间。
通过计算人口除以州总面积,为人口密度创建一个新的状态变量。
2.为了使状态的着色彼此形成对比。
通过计算与每个状态平均值的偏差来创建新的状态变量。例如,假设您有3个州,其人口如下:
平均约为50。
每个状态的新变量的值如下:
您可以使用正数与负数形成对比的任何配色方案(有关许多地图配色方案的示例,请使用Google'colorbrewer')。