Answers:
与往常一样,它取决于您的目标和数据的性质。对于完全映射的数据,强大的工具是Ripley的L函数,它是Ripley的K函数的近亲。许多软件都可以对此进行计算。现在,ArcGIS可能会这样做。我还没检查 CrimeStat做到了。所以,做GeoDa和R。与相关地图一起使用的示例出现在
Sinton,DS和W.Huber。在美国绘制波尔卡及其种族遗产的地图。地理杂志第一卷 106:41-47。2007年
这是Ripley K的“ L函数”版本的CrimeStatic屏幕截图:
蓝色曲线记录了非常非随机的点分布,因为它不位于零周围的红色和绿色带之间,这是随机分布的L函数的蓝色迹线应位于的位置。
对于采样数据,很大程度上取决于采样的性质。史蒂文·汤普森(Steven Thompson)的教科书《采样》(Sampling)是一个很好的资源,可供那些数学(数学)和统计领域(但并非完全没有)的人使用。
通常情况下,大多数统计比较都可以通过图形方式进行说明,而所有图形比较都对应于或建议有统计对应项。因此,您从统计文献中得到的任何想法都可能会建议一些有用的方法来映射或以图形方式比较两个数据集。
注意:以下是根据胡伯尔的评论编辑的
您可能要采用蒙特卡洛方法。这是一个简单的例子。假设您要确定犯罪事件A的分布在统计上是否类似于B的分布,您可以将A和B事件之间的统计量与这种措施的经验分布进行比较,以随机重新分配“标记”。
例如,给定A(白色)和B(蓝色)的分布,
您可以将标签A和B随机重新分配给组合数据集中的所有点。这是单个模拟的示例:
重复多次(例如999次),对于每次模拟,您都将使用随机标记的点计算统计信息(在此示例中为平均最近邻居统计信息)。后面的代码段在R中(需要使用spatstat库)。
nn.sim = vector()
P.r = P
for(i in 1:999){
marks(P.r) = sample(P$marks) # Reassign labels at random, point locations don't change
nn.sim[i] = mean(nncross(split(P.r)$A,split(P.r)$B)$dist)
}
然后,您可以以图形方式比较结果(红色垂直线是原始统计数据),
hist(nn.sim,breaks=30)
abline(v=mean(nncross(split(P)$A,split(P)$B)$dist),col="red")
或数值上。
# Compute empirical cumulative distribution
nn.sim.ecdf = ecdf(nn.sim)
# See how the original stat compares to the simulated distribution
nn.sim.ecdf(mean(nncross(split(P)$A,split(P)$B)$dist))
请注意,平均最近邻居统计信息可能不是解决您问题的最佳统计方法。诸如K函数之类的统计信息可能会更具有启发性(请参阅胡布的答案)。
可以使用Modelbuilder在ArcGIS中轻松实现以上内容。循环中,将属性值随机重新分配给每个点,然后计算空间统计量。您应该能够将结果汇总到表格中。
spatstat
程序包中的函数。
一种简单而快速的方法是创建热图和这两个热图的差异图。相关:如何建立有效的热图?
您可以在许多统计软件中运行双变量相关性分析,以确定两个变量之间的统计相关性水平和显着性水平。然后,您可以通过使用chloropleth方案映射一个变量,并使用刻度符号映射另一个变量来备份统计结果。覆盖后,您可以确定哪些区域显示高/高,高/低和低/低空间关系。此演示文稿有一些很好的例子。
您也可以尝试一些独特的地理可视化软件。我非常喜欢CommonGIS用于这种类型的可视化。您可以选择一个社区(您的示例),所有有用的统计数据和图表都将立即可供您使用。它使对多变量映射的分析变得非常轻松。
平方分析对此非常有用。这是一种GIS方法,能够突出显示和比较不同点数据层的空间模式。
可在http://www.nccu.edu/academics/sc/artsandsciences/geospatialscience/_documents/se_daag_poster.pdf上找到量化多点数据层之间空间关系的方差分析的概述 。