如何基于核密度对点进行聚类?


10

我有一个大型数据集,其中有36k个点代表商业土地用途,每个点都有一个包含平方英尺的字段。我已经对该数据集进行了内核密度分析,生成了一个栅格,显示了整个都市区域内商业平方英尺的密度。我需要将此栅格划分为与局部最大值相对应的区域,我称其为“中心”。我已经确定了中心的位置,现在我需要做以下两件事之一:

  • 使用点聚类工具(例如“围绕类固醇分区”)将点分组到围绕我确定的中心的聚类中。这种方法的问题在于计算量大,如果我尝试使用相异矩阵按大小对点加权,则更是如此。

  • 以某种方式将内核密度栅格(大致类似于地形栅格)划分为每个中心周围的各个“山丘”。但是我想不出什么工具可以做到这一点。

这个问题困扰了我一阵子,我希望我能够在R中执行聚类方法,但是这很耗时,我已经没时间了。有谁知道将密度栅格划分为强度邻域或快速聚类大型数据集的简单方法吗?



1
事实证明,它也是由我发布的。
Patrick

我认为这将是Patrick的1分.....
BWill

Answers:


6

密切相关的帖子之后的讨论揭示了一种简单有效的解决方案:找到“丘陵”,将网格上下颠倒(通过否定其值)并找到分水岭。山丘是水槽,分水岭边界将网格划分为这些水槽。


该解决方案简单,快速,完全符合我的需求。谢谢。
帕特里克

3

最简单的答案是使用阈值掩盖掉低于阈值的区域。这应该为您提供中心周围的独特区域。然后,它应该能够将那些区域转换为形状。

您可能还会发现空间统计工具:对栅格数据聚类分析是对类似问题的有用讨论。


是的,这是一个非常相关的讨论!我正在阅读您的理学硕士论文,并将尝试一些方法。
Patrick

2
在这里使用阈值可能不起作用,因为我试图将中心与紧邻的其他中心区分开。在城市核心区,两者之间的边界将具有非常高的密度,而在郊区边缘,它将具有非常低的密度。但我希望使用二阶导数会有效。
Patrick

3

我认为您应该回到最初的问题:在整个都市圈中找到一系列商业平方英尺。

我假设您的点是具有商业平方英尺价值的包裹质心?我假设您还可以有一个多边形多边形图层,每个图层的总平方英尺数是多少?这样就分别为商业广告素材和商业广告素材提供了一个案例集(质心)和总体(地块多边形)。

转到SatScan http://www.satscan.org/,运行仅由Poisson分布的空间模型,您将以非常快速的顺序获得商业平方英尺的群集。(您也可以使用土地的平方英尺作为您的人口,而不是建筑空间的平方英尺。这甚至可能是更好的人口。)


没错,点是质心,但是不幸的是,数据集是由其他人从每个县的地块图层编译而来的,仅作为点分布。但是SatScan看起来像是一个非常有用的软件,因此对于其他应用程序,我会牢记。
Patrick
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.