克里金法时为什么必须提供方差图模型?


9

我对空间统计非常陌生,并观看了很多教程,

但是我真的不明白为什么您在克里格时必须提供一个变异函数模型。

我在R中使用gstat包,这是他们提供的示例:

library(sp)
data(meuse)
coordinates(meuse) = ~x+y
data(meuse.grid)
str(meuse.grid)
gridded(meuse.grid) = ~x+y
m <- vgm(.59, "Sph", 874, .04)
print(m)
# ordinary kriging:
x <- krige(log(zinc)~1, meuse, meuse.grid, model = m)

有谁能在几行中解释为什么您首先必须提供vgm?以及如何设置参数?

先感谢您!卡斯珀


对于简单的克里金法,只有在提前知道均值和空间协方差的情况下,估计量才为蓝色。在普通克里金法中,人们从数据中估算出变异函数,然后进行插值。请gstatR包中查看具有相同用法数据的小插图
安迪W

嗨,安迪,感谢您的评论。我在小插图中发现,即使没有变异函数模型,您也可以克里格。我做了以下操作:krige(residuals〜1,temp_plot_spatial,y,nmin = 5,nmax = 10),所以krige只看最少5个邻居,最多10个邻居。这是否有意义?结果有点不错:dropbox.com/s/7lxvfiyfl7ekhb4/…–
Kasper

我认为对方差图建模存在问题:如果您假设相关性与距离无关,而与最近的邻居无关,该怎么办?
卡巴斯尔(Kasper)

“如果您假设相关性与距离无关,而与最近的邻居无关?” -那不是克里金法,它更符合knn分类。该代码krige(residuals~1 ,temp_plot_spatial, y, nmin=5, nmax=10)估计局部变异函数。例如,您没有整个研究空间的方差图,但要为要尝试预测的每个位置估计一个新模型。然后,本地模型仅获取最接近的10个值(由于您未指定最大距离,因此它应始终获取10个值,因此nmin应该是多余的)。
安迪W

1
然后,估计局部变异函数是合乎逻辑的事情。如果它们根据某些功能(包括模型中的其他预测变量)而有所不同,则也可以选择。IDW可能被认为是最简单的克里金模型类型-因此IDW应该不比从数据实际估计变异函数更好。
安迪W

Answers:


9

简介与摘要

托布勒地理法则断言

一切都与其他事物相关,但近处的事物比远处的事物更相关。

克里格(Kriging)采用了这些关系的模型,其中

  • “事物”是在地球表面(或空间)位置的数值,通常表示为欧几里得平面。

  • 假定这些数值是随机变量的实现

  • “相关”用这些随机变量的均值和协方差表示。

(与空间点关联的随机变量的集合称为“随机过程”。)变异函数图提供了计算那些协方差所需的信息。

克里金是什么

克里金法专门用于在未观察到的地方预测事物。为了使预测过程在数学上易于处理,Kriging将可能的公式限制为观测值的线性函数。这使问题成为确定系数应为多少的有限问题。这些可以通过要求预测过程具有某些属性来找到。从直觉上讲,一个极好的属性是预测变量与真实(但未知)值之间的差异应该趋于小:也就是说,预测变量应该是精确的。吹捧但又值得怀疑的另一个特性是,平均而言,预测变量应等于真实值:应该准确

(坚持完美准确性的理由值得怀疑,但不一定是坏的原因是,它通常会使统计程序的准确性降低:也就是说,可变性更大。在对目标进行射击时,您希望将击中的东西均匀地散布在目标周围。边缘且很少碰到中心,还是您会接受仅紧靠中心但不完全对准中心的结果?前者是准确但不精确的,而后者是不准确但精确的。)

这些假设和标准(即均值和协方差是量化相关性的合适方法,线性预测将起作用以及预测值应尽可能精确以使其完全准确)-导致具有以下特征的方程组如果以一致的方式指定了协方差,则为唯一解。因此,所得的预测变量称为“ BLUP”:最佳线性无偏预测变量

波动图出现的地方

找到这些方程式需要对刚刚描述的程序进行操作。这是通过写下预测变量和被认为是随机变量的观测值之间的协方差来完成的协方差代数也使观测值之间的协方差也输入到Kriging方程中。

在这一点上,我们到达了死胡同,因为这些协方差几乎总是未知的。毕竟,在大多数应用中,我们仅观察到每个随机变量的一种实现:即我们的数据集,该数据集在每个不同的位置仅构成一个数字。输入变异函数:这个数学函数告诉我们任何两个值之间的协方差应该是多少。必须确保这些协方差是“一致的”(从某种意义上讲,它永远不会给出在数学上不可能的一组协方差:并非所有“相关性”数值量度的集合都将形成实际的协方差矩阵)。这就是为什么方差图对于Kriging必不可少的原因。

参考文献

因为已经回答了紧迫的问题,所以我将在这里停止。感兴趣的读者可以通过参考Journel&Huijbregts的Mining Geostatistics(1978)或Isaaks&Srivastava的等优秀文章来学习如何估计和解释方差图。 Applied Geostatistics(1989)。(注意,估计过程中引入了两个对象称为“变异函数”:一个经验变差函数从数据和衍生型号,其装配到它变差函数在这个答案为“变差”的所有参考模型的调用。vgm在这个问题返回模型变异函数的计算机表示形式。)有关将变异函数估计和Kriging适当组合的更现代方法,请参见Diggle&基于模型的Geostatistics(2007)(这也是R软件包GeoR和的扩展手册GeoRglm)。


注释

顺便说一句,无论您是使用Kriging进行预测还是使用其他算法,变异函数提供的相关性的定量表征都可用于评估任何预测程序。请注意,从这个角度来看,所有空间插值方法都是预测变量,其中许多是线性预测变量,例如IDW(逆距离加权)。变异函数图可用于评估任何插值方法的平均值和离散度(标准偏差)。因此,它的适用性远远超出了在克里金法中的应用。


感谢您提供详细的答案。我问与上述相同的问题,如果我不能假设空间相关性与位置无关,该怎么办?这样对方差图建模就没有用了,因为我必须为所有位置都建立一个方差图模型,这是正确的吗?那么使用IDW更好吗?
卡巴斯尔(Kasper)

当您不能假定流程的二阶平稳性时,则有以下几种选择:(1)收集流程的多个实现(当它随时间变化时);(2)估计局部子区域的方差图(当有大量数据时);(3)假设一个参数模型,用于确定变异函数如何随位置变化(如在一维过程的GARCH模型中)。我最后的评论直接解决了不建议使用IDW之类的建议:原则上,是否可以估计方差图,是否存在,因此IDW通常不是最佳选择。
ub
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.