在来自不同层的另一组点周围找到一组点的聚类?


10

我想看看某种类型的建筑物(x)是否围绕另一种类型的建筑物(y)聚集。

两点文件位于不同的层中。

我无法弄清楚该使用哪种工具。

Answers:


9

ArcGIS(或任何其他GIS,AFIAK)中的现成工具都无法正确完成此工作。

在这样的问题中,您需要量化“聚类”的含义,然后需要建立概率模型,以评估所测量的聚类程度是否可能由偶然的机会产生。

作为进行操作的示例,您可以选择根据类型x的建筑物与最近的类型y的建筑物之间的典型距离来测量聚类。这是一个简单的计算:简单地通过单独的点层表示两组建筑物,并执行Y与X的空间连接。现在,属性表对于每种类型的x建筑物仍然具有一个记录,现在将包括到最近的y的距离。您可以使用平均距离作为度量。

测试这是否可能是偶然的结果比较棘手。对此设置的一种合理解释是,y型建筑物的早期存在鼓励了相对接近yx型建筑物的发展。否则,我们可能假设x型建筑物可能已经建在其他建筑物也出现的任何地方 这导致以下简单的置换测试。创建可能已出现x型建筑物的所有可能位置的点层。该层可以是与x相同的时间段内竖立区域中所有建筑物的位置建筑物(当然包括x建筑物本身)。在空间上连接y层以获得与最近的y型建筑物的距离。其余的计算在属性表上进行:完成了地理计算。您将要做的是重复使用随机数生成器来获取所有这些建筑物的简单随机样本,每个样本具有与x型建筑物一样多的元素。计算此样本的平均距离。重复该操作,直到获得许多平均距离统计信息为止。如果几乎所有这些随机获得的平均距离都大于您为x测得的平均距离键入建筑物,您可以得出结论x并非偶然聚集:效果是真实的。

(此类计算最好在适合于此目的的平台上进行编程,例如“ R”,但是几乎所有计算软件都可以投入使用,甚至包括Excel。该编程非常简单,只需要知道如何编写循环和选择即可。数组中的元素)。

这种排列测试方法优于预先编程的解决方案,因为它明确考虑了该领域的建筑开发模式。如果您不这样做,通常发现聚类的“重要”证据,但是您不能从中得出任何有用的结论,因为聚类可能是由其他因素引起的,例如道路的格局,道路的位置适合开发的网站,以及许多其他东西。


1
我知道这个答复有点抽象。当我有更多时间时,我将尝试创建逼真的插图。
ub

对于使用R的用户,我建议给spatstat包(cran.r-project.org/web/packages/spatstat/index.html)进行聚类分析。
om_henners 2011年

2

当然,您的数据分析方法应取决于激励分析的实质性问题。

但是这里有一些想法:

从ESRI:

多距离空间聚类分析的方式:Ripley的k函数(空间统计),等式中的i和j表示建筑物x和y。Ripley的K函数将提供概率推断。

来自计算机科学:

您可以通过谷歌搜索用于共址模式发现的复杂算法。


“简单图解想法”很有趣,但是您需要将其与之进行比较:就其本身而言,很难从中提取有用的信息。Ripley的K函数也是一个有用的工具,但不幸的是,在许多情况下,它仅反映数据集的几何形状。对于郊区或农村地区的房屋,它们往往沿线性要素(道路)分布,仅出于这个原因,K函数将清楚地显示“重要”的聚类。这样一来,除了在道路附近建造房屋外,它没有任何其他有用的信息!
ub

@whuber 1st感谢您对Ripley K函数问题的解释。第二,当我们看到股价随时间变化的曲线图时,我们可以寻找总体趋势的上升或下降或随机变化,也可以选择出现大幅下降或上升的时间并询问原因。可以以相同的方式使用建筑物浓度随距离变化而变化的图表。它可以用于搜索浓度峰值,这是针对随机分布的证据,也可以用于进一步研究好奇的峰值。
b_dev 2011年

你是对的。我的观点是,情节本身并没有告诉我们有关聚类的任何信息。也许是一个很好的类比(而不是股价),是按美国2000-2010年州的肾脏癌病例数的choropleth图。这也没有告诉我们有关(地理)聚类的任何信息,因为它没有考虑州之间人口的差异。同样,跨K图需要适当的归一化或参考才能解释。总体趋势,峰值等可能仅反映了所有建筑物位置的地理格局。
ub

@whuber你是对的。在阅读了您的上述评论之后,我决定我的“简单情节构想”将不会提供太多信息,至少正如所描述的那样,因此我将其删除以免引起人们的混淆。我现在认为联合计数统计是解决此问题的最简单方法。
b_dev 2011年

2

我自己从未在GIS中进行过聚类分析,但是如果您创建点/多边形来表示给定的X和/或Y聚类,可能会更容易。例如,如果创建了表示建筑物Y的点,则可以使用“ 点距离”工具获取建筑物X的所有点,这些点在距原点位置的给定距离内。

否则,如果没有ArcInfo,则在Y型建筑物周围创建缓冲区并选择所有X型建筑物将获得相同的结果。


0

您可以通过添加二进制列(0,1)来识别建筑物是来自X还是来自Y,从而将这两层结合起来。

从那里,您可以使用GeoDa识别局部空间自相关(聚类),并确定它是高低(一层围绕另一层群集)低高(逆)还是高高或低低(自群集)。此处的用户指南(.pdf)

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.