是什么导致空间相关图中出现U形图案?


12

在我自己的工作中,我注意到在检查不同距离的空间相关图时会出现这种模式,在相关中出现了U形模式。更具体地,在小距离箱处的强正相关随距离而减小,然后在特定点到达凹坑,然后向上爬回。

这是来自自然生态保护博客“ 宏观生态游乐场”(3)–空间自相关的示例。

莫兰的我相关图

这些在更远距离上更强的正自相关理论上违反了Tobler的第一地理定律,因此我希望它是由数据中的其他某种模式引起的。我希望它们在某个距离处达到零,然后在更远的距离处徘徊在0左右(这在具有低阶AR或MA项的时间序列图中通常会发生)。

如果您执行Google图片搜索,则可以找到这种相同类型的图案的其他一些示例(另请参见此处)。在GIS站点的用户发布了两个例子,该模式出现莫兰的我,但不会出现Geary的C(12)。结合我自己的工作,这些模式对于原始数据是可观察到的,但是当使用空间项拟合模型并检查残差时,它们似乎不会持续存在。

我没有在时间序列分析中遇到过显示相似的ACF图的示例,因此我不确定原始数据中的哪种模式会导致这种情况。此评论中的Scortchi推测正弦曲线模式 可能是由于该时间序列中省略的季节性模式引起的。同一类型的空间趋势会在空间相关图中导致这种模式吗?还是相关性计算方式的其他人工产物?


这是我工作的一个例子。样本很大,浅灰色的线是原始数据的19个排列的集合,以生成参考分布(因此可以看到红线的变化预计会很小)。因此,尽管该图并不像第一个所示的那样戏剧性,但是在该图中很容易出现深坑,然后再上升。(还请注意,我的陷阱与其他示例一样不是负面的,如果这在本质上使示例有所不同,我不知道。)

在此处输入图片说明

这是数据的核密度图,以查看产生所述相关图的空间分布。

DC中的KDE犯罪


1
我不确定这是否正确,因此我没有将其发布为答案,但是我的猜测是,在较小的距离内,几乎没有观测值,而高度相似的观测值也是如此。在适度的距离处,更多的观测结果变为“附近”,但它们之间的相似性较差,因此效果消失了。在很远的距离,所有东西都在附近,所以很大但很远的效果使后退。(顺便说一下,这是我学习故乡的高五)一世
Sycorax说Monica恢复

我可以看到@ user777的来源,尽管我可能期望有一个类似的论点,这将导致情节渐近地趋于0,空间邻域也会变大。也就是说,随着邻域的增大,邻域均值将越来越接近均值。在我的脑海中(我认为),这会使相关性趋于零,虽然不是零,但是我很容易错。(同样的论点也应适用于时间序列,但我不记得看到类似这样的时间序列的任何ACF图了。)
Andy W

DC的kde使我想起了棋盘。棋盘的空间自相关图会是什么样?我想知道在近距离(相同的正方形)处是否不高,在更远的距离处(不同的正方形处)是否较低,然后又较高。不过,我对这个主题的了解还不足以知道是否是答案。
gung-恢复莫妮卡

@gung,这取决于您在这种情况下如何制定距离。对于具有女王连续性棋盘,它将成为负自回归项的同义词,对于一个时间序列,这将导致ACF图在正和负相关之间交替(并且波动会衰减,在这种情况下可能很快) )。尽管在空间分析中要比在时间序列中复杂。我不会将这种模式描述为棋盘格。
2014年

2
您的数据集实际上没有足够的空间覆盖范围,因此您应该在5公里的距离上估算自协方差(整个区域的跨度不超过10公里,并且您通常希望拥有一个覆盖了在我看来,您基本上有3个大致呈三角形的高犯罪率“斑点”,斑点彼此之间相距约5K,并且两者之间存在间隙。因此,看到这样长度的正相关并不奇怪。
Brian Borchers 2014年

Answers:


4

说明

当在发生现象的区域的整个范围内进行u形相关图计算时,通常会发生这种情况。它在自然界中尤其表现出类似羽状现象,例如在土壤或地下水中的局部污染,或者在这种情况下,这种现象与人口密度有关,而人口密度通常朝研究区域的边界(区域)减少。哥伦比亚,拥有高密度的城市核心,被低密度的郊区所包围。

回想一下,相关图根据所有数据的空间分隔量总结了它们的相似度。较高的值越相似,较低的值越不相似。可以实现最大空间分隔的唯一点对是位于地图的直径相对两侧的那些点。因此,相关图将沿边界的值彼此进行比较。当数据值总体趋向于向边界减小时,相关图只能将小值与小值进行比较。可能会发现它们非常相似。

因此,对于任何羽状或其他空间单峰现象,我们可以在收集数据之前就预料到,相关图可能会减小,直到达到该区域直径的一半左右,然后才开始增大。

次要影响:估计差异

第二个效果是,短距离比长距离有更多的数据点对可用于估计相关图。在中长距离处,此类点对的“滞后种群”减少。这增加了经验相关图的可变性。有时,仅此可变性就会在相关图中创建异常图案。显然,在上图(“ Moran's I”)中使用了一个较大的数据集,该数据集可减轻这种影响,但是,可变性的增加在图中距离超过3500左右的图中较大的局部波动幅度中很明显:正好是最大距离。

因此,空间统计中的长期经验法则是避免在距离大于研究区域直径一半的距离处计算相关图,并避免使用如此大的距离进行预测(例如插值)。

为什么空间周期性不是完整的答案

有关空间统计的文献确实指出,空间周期模式会在较大距离处引起相关图中的反弹。采矿地质学家将其称为“井眼效应”。为了对其建模,存在一类包含正弦项的变异函数。但是,这些变量图也都随距离而强加了一些衰减,因此不能解释第一幅图所示的完全相关的极端返回。此外,在二维以上的情况下,现象既不可能是各向同性的(方向相关图都相同)又是周期性的。因此,仅数据的周期性将无法说明所显示的内容。

可以做什么

在这种情况下进行的正确方法是接受现象不是平稳的,并采用以某种潜在确定性形状(“漂移”或“趋势”)描述它的模型,该漂移周围还会有其他波动可能具有空间(和时间)自相关。诸如犯罪计数之类的数据的另一种方法是研究不同的相关变量,例如每单位人口的犯罪率。


谢谢,您认为需要对边缘效果进行临时加权吗?(这可能是对模型残差进行探索性分析的过大杀伤力。)我的论文实际上是在使用非线性空间漂移和趋势项-每单位人口的犯罪率令人讨厌,原因有很多。居住人口并不是真正的关注基线-更像是四处走动的人口。在市区内,这可能会在某些小时内大量膨胀(20到30次),并且与非住宅机构(工作和娱乐场所)关系更大。
安迪W

Andy,您有很多选择,因为无法识别唯一的模型:您需要确定要在何处停止对值进行空间漂移建模,然后开始对它们(或更确切地说,它们的残差)进行建模。随机空间模型。U形相关图可以理解为强烈表明需要某种模拟漂移的机制。通过相关人口进行归一化(即使只能进行粗略估算)是您可以使用的一种方法。将人口的度量(或使用等)作为协变量是另一回事。
ub

我只是使用一系列活动性的土地使用量指标(酒吧,加油站,医院,学校等)加上空间条件来进行讨论。这是使其他协变量保持不变的预测图。但是,仍然存在一小部分残余自相关。我对此错误表示怀疑,认为该人口到小地方的占地映射有多大帮助,但我想我最终会进行分析。
安迪W

这是一种原则性的方法:让理论指导模型漂移分量的发展,然后评估残差以确定是否值得为其空间自相关建模的麻烦。在许多情况下,大多数表观空间关系可以用漂移项充分解释,很少需要完整的地统计机制。问题的一个有趣方面是,潜在的指标(空间距离)可以说是沿着街道网络的行驶时间或行驶距离而不是欧几里得距离。
ub
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.