莫兰I的强大替代品
Moran的I(一种衡量空间自相关的指标)并不是一个特别可靠的统计数据(它可能对空间数据属性的偏斜分布敏感)。 有哪些更健壮的技术来测量空间自相关?我对像R这样的脚本语言中易于使用/可实现的解决方案特别感兴趣。如果解决方案适用于独特的情况/数据分布,请在答案中指定。 编辑:我正在用一些示例扩展问题(以回应对原始问题的评论/答案) 有人建议,置换技术(使用蒙特卡洛程序生成Moran's I采样分布)提供了一种可靠的解决方案。我的理解是,这种测试消除了对Moran's I分布进行任何假设的需要(假设测试统计量可以受数据集的空间结构影响),但是,我看不到置换技术如何正常地校正分布式属性数据。我提供两个示例:一个示例说明了偏斜数据对局部Moran I的统计影响,另一个示例对整体Moran I的影响-即使在置换测试下也是如此。 我将使用Zhang 等。的(2008)分析为第一个例子。在他们的论文中,他们使用置换测试(9999个模拟)显示了属性数据分布对局部Moran I的影响。我已经使用原始数据(左图)和对相同数据的对数转换(右图)在GeoDa中重现了作者针对铅(Pb)浓度(在5%置信水平)的热点结果。还显示了原始Pb和对数转换后的Pb浓度的箱线图。在这里,转换数据时,重要热点的数量几乎翻了一番。此示例表明,即使使用蒙特卡洛技术,本地统计信息对属性数据的分布也很敏感! 第二个示例(模拟数据)演示了偏斜数据可能会对全局Moran I产生的影响,即使使用置换测试也是如此。R中的示例如下: library(spdep) library(maptools) NC <- readShapePoly(system.file("etc/shapes/sids.shp", package="spdep")[1],ID="FIPSNO", proj4string=CRS("+proj=longlat +ellps=clrk66")) rn <- sapply(slot(NC, "polygons"), function(x) slot(x, "ID")) NB <- read.gal(system.file("etc/weights/ncCR85.gal", package="spdep")[1], region.id=rn) n <- length(NB) set.seed(4956) x.norm <- rnorm(n) rho <- 0.3 # autoregressive parameter W <- nb2listw(NB) # …