Questions tagged «clustering»

根据数据相互之间的“相似性”将数据分区为对象的子集,而无需使用诸如类标签之类的现有知识。

7
使用PostGIS进行空间聚类?
我正在寻找空间聚类算法,以便在支持PostGIS的数据库中将其用于点要素。我将编写plpgsql函数,该函数将同一群集内的点之间的距离作为输入。在输出函数处返回集群数组。最明显的解决方案是在特征周围建立指定距离的缓冲区,并在该缓冲区中搜索特征。如果存在此类功能,则继续在其周围构建缓冲区,等等。如果不存在此类功能,则意味着集群构建已完成。也许有一些聪明的解决方案?

5
使用QGIS识别矢量点数据中的聚类吗?
我有一个农村宽带数据点(有多快等)的矢量数据集,我想探讨是否存在具有相似特征的点簇,并绘制包含它们的多边形。 例如,在一个分布在景观上的单个PostGIS数据集中,我可能有45,000个点。我想确定彼此位于x公里以内且速度低于y kbps的群集,并为每个合格群集生成凸包。 例如,在QGIS中是否有一种简单的方法?

7
在R中将空间数据聚类 [关闭]
我有一堆经度和纬度的数据点。我想使用R根据它们的距离对它们进行聚类。 我已经看过此页面并尝试过clustTool软件包。但是我不确定clustTool中的clust函数是否将数据点(纬度,经度)视为空间数据,并使用适当的公式来计算它们之间的距离。 我的意思是我看不到它们如何区分空间数据和序数数据。我相信地图(空间)上的两个点与两个法线之间的距离计算是不同的。(不是吗?) 如果我想在集群中考虑第三个参数,还会发生什么? 就像说如果我有(lat,lon)和另一个参数。 距离如何计算? 我在clustTool上遇到的另一个问题是,它在设计时考虑了GUI。我不知道如何跳过库中的GUI开销,因为我不需要它。 我在R中有哪些选项可用于空间数据的聚类分析?

9
从GPS轨迹创建基于折线的“热图”?
今年冬天,我计划使用GPS跟踪下坡滑雪/单板滑雪。我的大部分骑行都将在同一度假村进行。我希望能够创建一种“热图”,以显示我在给定区域内进行的运行次数。当我向数据库中添加越来越多的GPS轨迹时,我的目标是看到一种最频繁旅行的区域的线性热图。考虑到下坡滑雪的性质,您会希望上坡的吊椅索道将是“最热”的路线,因为它将是唯一一遍又一遍的地方。 假设1)我的轨迹每次都不相同,以及2)进行一次“运行”所覆盖的区域可能是几百英尺宽,那么分析这种“线性”数据以创建一种分类的最佳方法可能是什么热图?我的想法是缓冲线条,然后将多边形相交以得到某种维恩图图。我更喜欢使用开源技术。我已经加载了QGIS和PostGIS并可以使用。 更新:关于@ blah238的响应,我在想一些可能可以“收集”通过某个区域的通过次数(“行程”),然后以计数表示的东西。从概念上讲,这类似于ArcGIS的“ 收集事件 ”(但对于线而不是点)或将双线折叠为中心线(但对于大致相同区域中的多条线)。 类似概念的一个更直观的示例可能是交通流图,其中高度拥挤的区域等同于“高度行驶”的滑雪道/区域: 我阅读了以下问题,这些问题可能会提出一些想法,但是它们并没有真正解决我要完成的任务: 聚类轨迹((x,y)点的GPS数据)和数据挖掘 使用GPS路线管理错误(理论框架?)

1
寻求区域化/限制范围的工具?
这篇文章是社区维基。编辑现有答案以改善此职位。它当前不接受新的答案。 我正在寻找用于GIS中的区域化/分区的工具。 到目前为止,我已经能够确定 分区 ArcGIS扩展(现在也在线) REDCAP(当前限制为50k个输入多边形) iRedistrict(尚未发布) R法 那里还有其他可用的东西吗?特别是在处理相当大的数据集[〜130万个多边形]时不会出现问题的东西吗?

1
使用QGIS对多个栅格图层进行聚类以创建子区域?
我试图根据一堆重叠栅格图层(物理图层,例如:深度,电流,波浪)的聚类分析,从多边形创建n个子区域。 当前,我可以在多边形上创建规则的网格,然后从物理栅格图层中提取物理属性(例如:Gridspot或等效工具),然后运行仅限于n个聚类的聚类分析(在R或其他统计数据包中)。 然后,我可以识别每个群集组,然后将它们重新绘制到GIS(QGIS或ArcMap)中。但是,我设想某些群集组将分散(空间离群值并且没有意义),而有些群集将聚集(值得成为一个子区域)。 然后,我可以手动绘制代表性块以创建n个子区域。 是否有可以在QGIS中运行的工具如ArcMap 10.1 分组分析?我只运行10.0。 是否有更好的方法建议对多个栅格图层进行聚类分析,以创建n个子区域(生物区域)?

4
如何生成包含最少n个点的不规则网格?
给定大量(约100万个)不均匀分布点的样本-是否可以生成包含指定最小n点数量的不规则网格(大小,但形状是否可能不规则?)? 对于我来说,如果这样的网格的“细胞”精确地包含n个点或至少n个点,那么对我来说就不那么重要了。 我知道诸如ArcGIS中的genvecgrid或QGIS / mmgis中的Create Grid Layer之类的解决方案,但是它们都会创建常规网格,从而导致输出的单元格为空(较小的问题-我可以简单地丢弃它们)或具有点数的单元格小于n(更大的问题,因为我需要一种解决方案来聚合这些单元格,可能使用此处的一些工具?)。 我一直闲逛无济于事,并且对商业(ArcGIS和扩展)或免费(Python,PostGIS,R)解决方案都开放。
20 r  clustering  quadtree 

1
QGIS 3.0点簇渲染器,可以控制渲染顺序(z顺序)吗?
我一直在使用QGIS 3.0.2中的新点聚类渲染器,它很棒-比必须自己进行聚类要容易得多(而且更快)。 为了说明我的意思,这是一个使用STATS19数据和30m半径的爱丁堡道路交通事故的示例。 我不知道如何设置z顺序,以便在较小的群集前面绘制最大的群集。 我知道@cluster_size变量-这就是我用来缩放和着色符号的方式。为此,我使用了尺寸和颜色助手。我删除了字体标记以从每个群集中删除文本。 标记的大小定义如下: coalesce(scale_exp(@cluster_size, 0, 50, 1, 200, 0.57), 0) 标记的颜色定义如下: coalesce(ramp_color('custom ramp',scale_linear( @cluster_size, 0, 50, 0, 1), '#000000') 到目前为止,我已经尝试过: 符号等级 -没有运气;无法选择变量名称。 图层渲染>控制要素渲染顺序,然后选择@cluster_size作为排序。似乎没有效果。 使用@cluster_size作为表达式的渐变样式无效。 有谁知道这是否可行,或者这是此特定渲染器的限制吗? 我知道还有很多其他方法可以做到这一点(缓冲区/空间连接,插件),但是新的渲染器应该更快。还是我忽略了明显的东西?:)

6
如何在OpenLayers / Leaflet中创建动画群集标记?
由于Openlayers似乎无法比拟的平滑过渡,我想使用Leaflet。我特别需要能够将标记与自定义样式的标记组聚类的功能。 可以在Redfin上找到证明我正在努力实现的最佳示例。 请注意,将鼠标悬停在群集上可提供流畅的动画,并通过单击标记将群集分割成动画效果。当达到单个点不与给定公差重叠的缩放级别时,实际标记将以动画方式拆分到其位置。 我真的很想将类似的效果整合到其中,并希望就最佳方法或您可能知道的其他示例提供一些指导。 注意: Redfin似乎正在使用Flash,我想远离它。在理想的情况下,我想尽可能通过Javascript实现此功能,但认为可能需要通过HTML5 / canvas完成。 也许使用p。-Raphael.js或d3.js 有任何想法吗? 顺便说一句-找到了这个例子,但它似乎特别适用于Google Maps。

3
聚集无向线
我正在寻找一种有效的方法来对线进行聚类,而与线的方向无关。这意味着,纽约和洛杉矶之间的路线应与洛杉矶和纽约之间的另一方向的路线位于同一群集中。起点/终点位置应相似(即,圣地亚哥到长岛的位置应与LA-NY在同一群集中,但旧金山和波士顿可能不在同一位置),并且没有中间点。输入数据将类似于此示例: (通过维基百科,通过日本维基百科GFDL或CC-BY-SA-3.0的仙后座甜蜜) 我以前曾尝试过预先对线进行排序,例如使它们全部从西向东延伸,但是这并不能解决从北向南或以其他方式延伸的线的问题。 您知道有什么算法可以解决这个问题吗?我一直在寻找,但是除了算法来计算无向片段的平均方向外,我还没有发现任何有用的远程帮助,因此我必须使用错误的搜索词。

3
可视化网络地图中的群集特征?
我正在寻找在ArcGIS Server JS API中显示群集功能的最佳符号。 我不喜欢Silverlight API群集或JS群集示例中使用的“飞出”动画群集符号(它们有点花哨)。 到目前为止,我发现的最佳选择是Google Maps 标记群集器符号。 我不会在群集符号的中心显示一个数字,但是将改变符号的大小以显示要素的集中度,如此模型所示: 还有哪些其他聚类符号选项?您能指出一张显示标记聚类很好实现的地图吗?

1
根据点位置和关联的点值对地理数据进行聚类
给定的数据点具有经度,纬度和该点的第​​三个属性值。如何基于属性值将点聚类为组(地理子区域)?我在Google上搜索后发现,这个问题似乎被称为“空间约束聚类”或“区域化”。但是,我对处理地理数据并不熟悉,也不清楚如何使用哪种算法,以及哪种python / R软件包适合此任务。 为了更直观地了解我想要的东西,假设我的数据散布图如下: 因此,每个点都是一个点,x是经度,y是纬度,并且颜色图显示值是大还是小。我想根据位置和值的相似性将这些点划分为子区域/组/集群。如下所示(这并不是我想要的,只是为了显示一个直观的想法。): 那么我该如何实现呢?

3
确定森林间隙内的树木是否使用R进行聚类?
所附的数据集显示了大约50个大小不一的森林林中的大约6000棵树苗。我对学习这些树苗如何在各自的间隙(即成簇,随机,分散)内生长感兴趣。如您所知,传统方法是运行Global Moran'sI。但是,间隙聚集中的树木聚集似乎是对Moran's I的不当使用。我对Moran's I使用50米的阈值距离进行了一些测试统计,产生了无意义的结果(即p值= 0.0000000 ...)。缺口聚集之间的相互作用很可能产生这些结果。我曾考虑过创建一个脚本来遍历各个树冠间隙并确定每个间隙内的聚类,尽管向公众展示这些结果是有问题的。 量化集群中集群的最佳方法是什么?

5
聚类轨迹((x,y)点的GPS数据)并挖掘数据
在分析GPS数据集时,我有2个问题。 1)提取轨迹我有一个庞大的数据库,记录着形式的GPS坐标(latitude, longitude, date-time)。根据连续记录的日期时间值,我试图提取此人遵循的所有轨迹/路径。例如; 比方说,时间到了M,结(x,y)对一直在不断变化N。之后N,(x,y)成对的变化减小,此时我得出结论,从时间M到N可以称为轨迹。提取轨迹时遵循的一种体面方法吗?有什么可以建议的知名方法/方法/算法吗?您是否想建议我以有效的方式维护这些观点的数据结构或格式?也许,对于每个轨迹,找出速度和加速度会有用吗? 2)挖掘轨迹一旦我遵循了所有轨迹/采取了路径,如何比较/组合它们?我想知道起点或终点是否相似,那么中间路径如何比较? 如何比较2条路径/路线,并得出结论是否相似。此外; 如何将相似的路径聚集在一起? 如果您能指出我对这件事的研究或类似内容,我将不胜感激。 开发将使用Python,但是欢迎各种库建议。 我正在打开完全相同的问题/programming/4910510/comparing-clustering-trajectories-gps-data-of-xy-points-and-mining-the-data在StackOverflow中。以为我会在这里得到更多答案...

4
使用ArcGIS Desktop查找X距离内的N个点的聚类?
我们尝试了两种聚类分析方法: 聚类和离群值 热点 ...但都不符合我们具有以下3个参数的规范: 一组点特征 群集中的N个点 要看的X距离带 例如“为我找到每个簇在50米内有10个点的点”或类似的东西。 ArcGIS 10具有我上面链接的两个工具,但似乎都不能解决群集零件中的N个点。 ArcGIS中的其他工具可以满足我们的要求吗?我所说的聚类分析称为一种特定的聚类类型吗? 我们在另一个应用程序中确实有此版本,但是我真的很想在ArcGIS中使用这些工具。

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.