“空间自相关”对各个人而言意味着各种事物。但是,最重要的概念是,在位置处观察到的现象可能以某种确定的方式取决于(a)协变量,(b)位置和(c)在附近位置的值。(在技术定义变化的地方在于要考虑的数据类型,假定的“确定方式”以及“附近”的意思:所有这些都必须经过量化才能继续。)ž
为了查看可能发生的情况,让我们考虑一个描述区域地形的空间模型的简单示例。让在点测得的标高是ÿ (Ž)。一种可能的模型是y以某种确定的数学方式取决于z的坐标,我将在这种二维情况下写出(z 1,z 2)。让ε代表观测值与模型之间的(假设上独立的)偏差(通常假定其期望值为零),我们可以写成žÿ(z)ÿž(z1,z2)ε
y(z)=β0+β1z1+β2z2+ε(z)
用于线性趋势模型。线性趋势(由所表示的和β 2系数)是捕获的想法的一种方式,附近的值Ý (Ž)和ÿ (Ž '),用于Ž接近Ž ',应趋向于接近彼此。我们甚至可以考虑之间的差异的大小的期望值计算该Ÿ (ž)和Ÿ (ž '),é [ | ÿβ1β2y(z)y(z′)zz′y(z)y(z′)。事实证明,如果使用稍有不同的差异度量,则数学要简单得多:相反,我们计算期望的平方差异:E[|y(z)−y(z′)|]
Ë[ ( y(z)− y(z′))2]= E[ (β0+ β1个ž1个+ β2ž2+ε(z)−(β0+β1z′1+β2z′2+ε(z′)))2]=E[(β1(z1−z′1)+β2(z2−z2)′+ε(z)−ε(z′))2]=E[(β1(z1−z′1)+β2(z2−z2)′)2+2(β1(z1−z′1)+β2(z2−z2)′)(ε(z)−ε(z′))+(ε(z)−ε(z′))2]=(β1(z1−z′1)+β2(z2−z2)′)2+E[(ε(z)−ε(z′))2]
该模型没有任何显式的空间自相关,因为其中没有将与附近的值y (z ')直接相关的项。y(z)y(z′)
另一种不同的模型忽略了线性趋势,仅假设存在自相关。一种方法是通过偏差的结构。我们可能会认为ε(z)
y(z)=β0+ε(z)
并且,考虑到我们对相关性的预期,我们将为假设某种“协方差结构” 。为了使它在空间上有意义,我们将假设ε (z)和ε (z ')之间的协方差等于E [ ε (z)ε (z ')],因为ε具有零均值,随着z趋于减小和ž '变得越来越遥远。因为细节无关紧要,所以我们称此协方差为Cεε(z)ε(z′)E[ε(z)ε(z′)]εzz′。 这是空间自相关。 实际上, y (z)和 y (z ')之间的(通常为Pearson)相关性是C(z,z′)y(z)y(z′)
ρ(y(z),y(z′))=C(z,z′)C(z,z)C(z′,z′)−−−−−−−−−−−−√.
在这种表示法中,第一个模型的的先前期望平方差为y
E[(y(z)−y(z′))2]=(β1(z1−z′1)+β2(z2−z2)′)2+E[(ε(z)−ε(z′))2]=(β1(z1−z′1)+β2(z2−z2)′)2+C1(z,z)+C1(z′,z′)
(假设),因为假定不同位置的ε是独立的。我写了C 1而不是C来表明这是第一个模型的协方差函数。z≠z′εC1C
当的协方差从一个位置到另一个位置变化不大时(实际上,通常假定它们是恒定的),该方程式表明y的期望平方差随z和z '之间的距离平方增加。增加的实际量由趋势系数确定β 0和β 1。εyzz′β0β1
让我们看看对于新模型(模型2),的期望平方差是多少:y
E[(y(z)−y(z′))2]=E[(β0+ε(z)−(β0+ε(z′)))2]=E[(ε(z)−ε(z′))2]=E[ε(z)2−2ε(z)ε(z′)+ε(z′)2]=C2(z,z)−2C2(z,z′)+C2(z′,z′).
同样,这表现在以正确的方式:因为我们计算 应该减少为ž和Z ^ '变得更加分离,在预期的平方差Ÿ的确实去了随位置的分离。C2(z,z′)zz′y
E[(y(z)−y(z′))2](β1(z1−z′1)+β2(z2−z2)′)2−2C2(z,z′)Ci(z,z)
ε)。在实践中,模型结合了两种方法。您选择哪种模型取决于您要使用模型完成的工作以及对空间自相关如何产生的看法-是潜在趋势所隐含还是反映了您希望随机考虑的变化。两种方法都不总是正确的,在任何给定的问题中,通常都可以使用两种模型来分析数据,理解现象并预测其在其他位置的值(插值)。