如何比较两个地图以确定哪个更好?


10

我正在尝试对同一地区的两个不同地图进行客观比较。目前,我正在努力定义一些标准,以使我能够进行公正的评估。

是否有人对如何执行此操作或应该如何解决该问题有任何想法?

如您所见,这两个地图都不是上等的,蓝色背景上有一些空白,红色背景上有一些空白。

在此处输入图片说明


7
这个问题定义很不明确?您所说的质量是什么意思?是否存在关于完整性,准确性,几何形状...的任何假设?是否存在要与之进行比较的第三个参考数据集?
petzlux

只是一个想法,为什么不使用高分辨率的航空影像来比较它们呢?甚至可以将它们转换为KML并评估其在Google Earth中的准确性。
亚伦

2
@Martin,您是否正在要求一种突出两层几何差异的方法?
Artwork21年

1
关于这个话题有很多文献。一些文件,让您开始:underdark.wordpress.com/projects/...
幽暗地域

1
这个问题真的与制图或地图无关,而是与数据质量无关吗?也许您可以改写您的问题,并在数据质量方面提供更多上下文。
blah238

Answers:


14

此答复描述了一种客观的方法来测量两个空间数据集之间的任意差异。 这样的差异可能包括一个数据集中但另一个数据集中不存在的位置偏移,形状变化和特征。该答复没有提供任何方法来确定哪个“更好”,因为这不仅取决于数据,还取决于更多的信息,尤其取决于数据将用于什么目的。

背景

大量此类测量的良好基础依赖于每个数据集的欧几里德距离变换。这会将每个数据集视为代表平面中点的集合。让我们将这些集合称为B表示蓝色特征,将R称为红色特征。

对于平面中的任何点x,点集A的欧几里德距离变换计算xA之间的距离的最大下限。我们可能认为此变换创建了一个“表面”,其x高度等于xA的最短距离。因此,该曲面在A的所有点(其高度为零)处均具有谷,并以1:1的斜率远离A上升。显然,距离变换反过来决定了A(或者从技术上说,它是指度量闭包,对于GIS数据集,它与A相同))作为高度为零的所有点的集合。因此,距离变换完全捕获了GIS能够表示的A的所有空间信息。

图1

该图显示了伪浮雕中B(在左侧)和R(在右侧)的距离变换。

比较两个数据集

要比较BR,将它们与另一个的距离变换重叠:

图2

距离值显示为从蓝色(接近0)到红色渐变的颜色。

例如,左侧的地图显示B的点,并根据它们与R的距离为其着色。BR的角色在右图中切换。

这些已经可以帮助进行比较:每张地图都显示一个数据集的点,并通过使用颜色来强调远离另一个数据集中任何点的点。请注意,两个地图都需要进行比较,因为每个地图都没有显示彼此的点。

在详细的地图上,颜色可能很难看清,因此我们可以选择稍微模糊一些颜色以进行显示或视觉评估:

图3

注意:这两个地图之间的颜色是无法比较的:在每个地图中,它们的颜色都经过缩放以显示该地图中的所有距离范围。

差异的统计分析

这种方法的优点在于可以在后处理中完成。使用栅格表示距离变换及其叠加图,我们可以轻松获取局部和全局统计数据以测量差异。例如,我们可以关注大于某个小阈值的所有距离,探索其频率分布:

图4

在此直方图中,蓝色条表示蓝色特征,红色条表示红色特征。(请注意水平轴上的对数刻度。)此直方图显示原始叠加数据,而不是导数模糊数据。它仅选择了原始图像中大于三个像素的那些距离。

这些直方图显示,蓝色特征比红色特征更可能远离红色特征,反之亦然:蓝色条比红色条更高,并且延伸到更大的距离(在右侧)。现在可以使用整个描述性统计信息库来量化两个数据集之间的差异。这些统计信息可以应用于整个感兴趣的区域,也可以应用于其上的“窗口”,以探索两个数据集如何根据位置而不同。

实作

大多数栅格GIS提供Euclidean距离转换(例如ArcGIS中的EuclideanDistance和GRASS中的r.grow.distance),并且都支持进行此分析所需的简单(掩盖)覆盖。如果需要,可以使用邻域均值或内核卷积(包括所有图像处理软件中可用的“高斯模糊”)来进行模糊处理。大多数GISes都不能提供栅格数据,全面的统计分析提供足够的支持,虽然,但他们善于在格式导出这些数据通过统计和数学软件读写,如R数学(这使这里所有的数字)。


与往常一样,您的答案读起来很有趣,我发现有新的东西需要学习和思考。您还可以告诉我如何创建“手绘”图形吗?
Devdatta Tengshe

3
@Devdatta直方图是在Mathematica中通过后期处理在mathematica.stackexchange.com/questions/11350/xkcd-style-graphs上对代码进行修改后创建的。此类图形的其他示例位于stats.stackexchange.com/questions/49123/…stats.stackexchange.com/questions/48973/…stats.stackexchange.com/questions/48467/…
ub

4

由于从外观上看这是一个几何验证问题,因此请加载当前图像,并查看是否可以验证现有或现有的街道。一个数据集可能较新和/或更完整。找出哪个数据集的水平精度最高,哪个数据集是最近收集的以及通过什么过程进行收集。Tiger,osm,gis和gps痕迹之间有区别吗?图像是您的朋友,至少是像最近年份的HAIP这样准确的图像。准则可能是完整性,覆盖范围,准确性,正确性,时效性。


1

我认为可以从上面的评论和答案中继续(也许这也应该是评论而不是答案),但我会使用现有的映射方法通过视觉比较来验证文件。选择可以获取准确的绘制数据的要素,例如道路网络(在OSS上可免费获得英格兰,苏格兰和威尔士)。

根据建议使用Google地球和图像。使用openlayers插件将卫星图像加载到背景中,然后再次进行比较。

许多免费的准确地图在那里用作比较的基础。


不幸的是,我开始基于OSM和其他OpenSource映射确实不像我们认为的那样准确的事实进行比较。但是,有关使用卫星图像的意见很重要!
Styp
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.