Moran的I(一种衡量空间自相关的指标)并不是一个特别可靠的统计数据(它可能对空间数据属性的偏斜分布敏感)。
有哪些更健壮的技术来测量空间自相关?我对像R这样的脚本语言中易于使用/可实现的解决方案特别感兴趣。如果解决方案适用于独特的情况/数据分布,请在答案中指定。
编辑:我正在用一些示例扩展问题(以回应对原始问题的评论/答案)
有人建议,置换技术(使用蒙特卡洛程序生成Moran's I采样分布)提供了一种可靠的解决方案。我的理解是,这种测试消除了对Moran's I分布进行任何假设的需要(假设测试统计量可以受数据集的空间结构影响),但是,我看不到置换技术如何正常地校正分布式属性数据。我提供两个示例:一个示例说明了偏斜数据对局部Moran I的统计影响,另一个示例对整体Moran I的影响-即使在置换测试下也是如此。
我将使用Zhang 等。的(2008)分析为第一个例子。在他们的论文中,他们使用置换测试(9999个模拟)显示了属性数据分布对局部Moran I的影响。我已经使用原始数据(左图)和对相同数据的对数转换(右图)在GeoDa中重现了作者针对铅(Pb)浓度(在5%置信水平)的热点结果。还显示了原始Pb和对数转换后的Pb浓度的箱线图。在这里,转换数据时,重要热点的数量几乎翻了一番。此示例表明,即使使用蒙特卡洛技术,本地统计信息对属性数据的分布也很敏感!
第二个示例(模拟数据)演示了偏斜数据可能会对全局Moran I产生的影响,即使使用置换测试也是如此。R中的示例如下:
library(spdep)
library(maptools)
NC <- readShapePoly(system.file("etc/shapes/sids.shp", package="spdep")[1],ID="FIPSNO", proj4string=CRS("+proj=longlat +ellps=clrk66"))
rn <- sapply(slot(NC, "polygons"), function(x) slot(x, "ID"))
NB <- read.gal(system.file("etc/weights/ncCR85.gal", package="spdep")[1], region.id=rn)
n <- length(NB)
set.seed(4956)
x.norm <- rnorm(n)
rho <- 0.3 # autoregressive parameter
W <- nb2listw(NB) # Generate spatial weights
# Generate autocorrelated datasets (one normally distributed the other skewed)
x.norm.auto <- invIrW(W, rho) %*% x.norm # Generate autocorrelated values
x.skew.auto <- exp(x.norm.auto) # Transform orginal data to create a 'skewed' version
# Run permutation tests
MCI.norm <- moran.mc(x.norm.auto, listw=W, nsim=9999)
MCI.skew <- moran.mc(x.skew.auto, listw=W, nsim=9999)
# Display p-values
MCI.norm$p.value;MCI.skew$p.value
注意P值的差异。偏斜的数据表明在5%的显着性水平上没有聚类(p = 0.167),而正态分布的数据表明存在(p = 0.013)。
张朝升,罗林,徐伟林,Valerie Ledwith,利用当地的Moran's I和GIS识别爱尔兰戈尔韦城市土壤中铅的污染热点,《整体环境科学》,第398卷,第1-3期,2008年7月15日,页212-221