Questions tagged «spatial-statistics»

有关统计方法的研究领域,这些统计方法在其数学计算中直接使用空间和空间关系(例如距离,面积,体积,长度,高度,方向,中心和/或其他数据空间特征)。

9
处理R中空间数据的教程?
有谁知道一些很好的教程来处理R中的空间数据?我知道有一些软件包,例如rgdal和maptools,但实际上我还没有找到有用的教程来与基本功能(读取,绘图,更改符号系统,联接数据等)取得联系和/或获得更广泛的概述。 R用于空间分析和处理空间数据的主要功能是什么?同时,也欢迎对书籍,论文,博客等的推荐。



7
在R中将空间数据聚类 [关闭]
我有一堆经度和纬度的数据点。我想使用R根据它们的距离对它们进行聚类。 我已经看过此页面并尝试过clustTool软件包。但是我不确定clustTool中的clust函数是否将数据点(纬度,经度)视为空间数据,并使用适当的公式来计算它们之间的距离。 我的意思是我看不到它们如何区分空间数据和序数数据。我相信地图(空间)上的两个点与两个法线之间的距离计算是不同的。(不是吗?) 如果我想在集群中考虑第三个参数,还会发生什么? 就像说如果我有(lat,lon)和另一个参数。 距离如何计算? 我在clustTool上遇到的另一个问题是,它在设计时考虑了GUI。我不知道如何跳过库中的GUI开销,因为我不需要它。 我在R中有哪些选项可用于空间数据的聚类分析?

7
对空间线型进行统计检验?
有很多关于空间点图案的测试可以用来确定点是否随机分布,但是是否有针对空间线图案的成熟测试?(我在想直线,只有起点和终点,没有中间节点。) 我要分析的数据是人和动物运动的OD(原点)线。(类似于聚类无向线中的示例。) 到目前为止,一个想法是像4D点那样处理线并使用点图案测试,但是我不确定是否合适。 理想的测试将使确定是否存在线簇成为可能。 本能地,我想说许多始于相同起点但具有各种不同目的地的线路不应被视为集群。另一方面,许多行(接近)并行较长时间的行将是一个群集。

2
如何使用ArcGIS,Python和SPSS / R进行地理加权主成分分析?
我正在寻求进行地理加权主成分分析(GWPCA)的描述/方法。我很高兴使用Python进行任何此操作,并且我想象SPSS或R用于在地理加权变量上运行PCA。 我的数据集由大约30个独立变量组成,这些变量在整个550个人口普查区域(矢量几何)中进行了测量。 我知道这是一个加载的问题。但是,当我进行搜索时,似乎没有任何解决方案。我遇到的是一些数学方程式,它们解释了GWPCA(和GWR)的基本组成。从某种意义上讲,我所追求的是更多的应用,我正在寻找从原始数据到GWPCA结果所需要完成的主要步骤。 由于下面收到的评论,我想在第一部分对此进行扩展。 为了向保罗讲话... 我基于以下论文对GWPCA感兴趣: 劳埃德,CD,(2010年)。使用地理加权主成分分析法分析人口特征:以2001年北爱尔兰为例。计算机,环境与城市系统,34(5),第389-399页。 对于那些没有文献资料的人,我随附了特定章节的屏幕截图,这些截图解释了以下数学: 为了解决胡言乱语... 在不赘述的情况下(机密性),我们尝试将30个变量(我们认为都是很好的指标)(尽管在全球范围内)减少为特征值大于1的组件集。通过计算地理位置加权分量,我们尝试了解这些组件所解释的局部方差。 我认为我们的主要目标是证明GWPCA的概念,即证明我们数据的空间明确性,并且我们不能认为所有自变量都可以在全球范围内解释。而是,每个组成部分将确定的局部规模(社区)将帮助我们理解数据的多维本质(如何将变量彼此组合以解释研究区域中的某些社区)。 我们希望映射每个组件所占的差异百分比(分别),以了解所讨论组件所解释的邻域范围(帮助我们了解组件的局部空间性)。也许还有其他一些映射示例,但目前还没有想到。 另外: 鉴于我在地理分析和社会统计方面的背景,GWPCA背后的数学超出了我的理解。数学的应用是最重要的,也就是说,我要如何插入这些变量/公式。

2
在R中连接多边形
我想知道如何使用R代码连接空间多边形? 我正在处理某些区域随时间变化的人口普查数据,我希望将多边形和相应的数据合并在一起,并仅报告合并区域。我正在维护一个具有随人口普查而变化的多边形列表,并计划合并。我想将此区域名称列表用作查找列表,以应用于不同年份的人口普查数据。 我想知道使用什么R函数来合并选定的多边形和相应的数据。我已经用谷歌搜索过,但是结果简直让我感到困惑。

5
学习空间统计?
我具有统计学方面的重要背景,并且想了解有关空间统计(以及与地理空间数据相关的统计)的更多信息。 对于寻求该领域概述的人来说,是否有任何特别好的资源? 我目前不打算解决一个特定的问题。只想了解该领域及其与非空间数据统计应用程序的区别。


1
莫兰I的强大替代品
Moran的I(一种衡量空间自相关的指标)并不是一个特别可靠的统计数据(它可能对空间数据属性的偏斜分布敏感)。 有哪些更健壮的技术来测量空间自相关?我对像R这样的脚本语言中易于使用/可实现的解决方案特别感兴趣。如果解决方案适用于独特的情况/数据分布,请在答案中指定。 编辑:我正在用一些示例扩展问题(以回应对原始问题的评论/答案) 有人建议,置换技术(使用蒙特卡洛程序生成Moran's I采样分布)提供了一种可靠的解决方案。我的理解是,这种测试消除了对Moran's I分布进行任何假设的需要(假设测试统计量可以受数据集的空间结构影响),但是,我看不到置换技术如何正常地校正分布式属性数据。我提供两个示例:一个示例说明了偏斜数据对局部Moran I的统计影响,另一个示例对整体Moran I的影响-即使在置换测试下也是如此。 我将使用Zhang 等。的(2008)分析为第一个例子。在他们的论文中,他们使用置换测试(9999个模拟)显示了属性数据分布对局部Moran I的影响。我已经使用原始数据(左图)和对相同数据的对数转换(右图)在GeoDa中重现了作者针对铅(Pb)浓度(在5%置信水平)的热点结果。还显示了原始Pb和对数转换后的Pb浓度的箱线图。在这里,转换数据时,重要热点的数量几乎翻了一番。此示例表明,即使使用蒙特卡洛技术,本地统计信息对属性数据的分布也很敏感! 第二个示例(模拟数据)演示了偏斜数据可能会对全局Moran I产生的影响,即使使用置换测试也是如此。R中的示例如下: library(spdep) library(maptools) NC <- readShapePoly(system.file("etc/shapes/sids.shp", package="spdep")[1],ID="FIPSNO", proj4string=CRS("+proj=longlat +ellps=clrk66")) rn <- sapply(slot(NC, "polygons"), function(x) slot(x, "ID")) NB <- read.gal(system.file("etc/weights/ncCR85.gal", package="spdep")[1], region.id=rn) n <- length(NB) set.seed(4956) x.norm <- rnorm(n) rho <- 0.3 # autoregressive parameter W <- nb2listw(NB) # …

1
计算特殊邻域的焦点统计?
我正在寻找在指定条件附近的栅格中每个像元的焦点统计信息。 背景-我有三个二进制栅格,每个栅格代表一种感兴趣的植被类型。我想计算研究区域内任何单元格(例如,总和/总单元格)在20 km ^ 2之内每种植被类型的覆盖率。问题是我不能在每个像元周围使用简单的圆形或正方形邻域,因为如果这样做,用于计算总和的搜索区域将包含我研究区域之外的区域。此例外非常重要,因为统计数据将用作栖息地模型的输入,并且不能将我研究区域之外的区域视为可能的栖息地-它们已被城市化。包括它们会给我错误的统计数据。所以,我n由覆盖符合我的标准的区域所需的像元数确定)。标准是它们不属于市区范围内。我在想应该使用某种形式的细胞自动机。我从来没有在CA工作过。 我想我想要的是入门代码,或指向正确方向的东西。 回复以下评论: 假设我正在为研究站点边界上的一个单元格计算此统计信息。如果我将研究区域以外的所有区域都分配为零(或忽略NoData),那么我将获得一个统计数据,该统计数据大约代表了我感兴趣的区域覆盖范围的一半。因此,在约10 km ^ 2的区域中,覆盖范围百分比,而不是20 km ^ 2的区域。由于我正在研究家庭范围的尺寸,因此这一点很重要。邻居必须改变形状,因为那是动物观看/使用景观的方式。如果他们需要20 km ^ 2,他们会改变形状或家园。如果我不检查忽略NoData,则单元格输出将为NoData-NoData没有帮助。 截至2014年10月24日的“进度” 这是到目前为止我使用Shapely和Fiona提出的代码: import numpy as np import pprint import shapely from shapely.geometry import* import fiona from fiona import collection import math traps = fiona.open('C:/Users/Curtis/Documents/ArcGIS/GIS_Data/occurrence/ss_occ.shp', 'r') study_area = fiona.open('C:/Users/Curtis/Documents/ArcGIS/GIS_Data/Study_Area.shp', 'r') for i in study_area: …

1
从GPS轨迹集统计计算真实道路?
我参加了一个长途骑行俱乐部,我们开始定期从骑手那里收集GPS数据。 我的兴趣是基于相同道路上累积的GPS数据计算未来事件的“真实轨迹”。基本上,这意味着将一些预选的轨迹传递给一种算法,并且该算法将以合适的采样率(取决于道路曲线,彼此之间的合适距离)生成点。我将仅考虑空间轨道信息而放弃时间戳。 我可以使用哪种算法/统计方法?我不使用任何GIS软件包,我计划用Python来实现。 下面是一些示例轨迹集:


3
生态地理空间难题
我正在寻找针对空间统计问题的另一种更优雅的解决方案。原始数据由每个单独树的xy坐标组成(即,转换为点.shp文件)。尽管在此示例中未使用,但是每棵树还具有代表顶冠直径的相应多边形(即.shp)。左侧的两个图像显示了从单个树位置的点.shp文件得出的景观尺度内核密度估计(KDE),一个是1989年,另一个是2009年。右图显示了两个KDE之间的差异。仅显示平均值的+/- 2标准偏差的值。使用Arc的栅格计算器执行在右侧图像上生成栅格叠加所必需的简单计算(2009 KDE-1989 KDE)。 有没有更合适的方法以统计或图形方式分析树木密度或冠层面积随时间的变化?有了这些数据,您将如何评估地理空间环境中1989年和2009年树木数据之间的变化?鼓励使用ArcGIS,Python,R,Erdas和ENVI中的解决方案。


By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.