我得到了一些带有标本数量的数据,并要求使用克里金法对其进行插值。
经过一些调查,似乎克里金法结果(在ArcGIS Geostatistical Analyst中使用默认参数执行)不令人满意。内插值与测量值(尤其是顶部值)相差很大,并且表面看起来不可靠。这是图片:
我想主要问题是样本数量不足。
我们应该使用多少点来获得可靠的结果?
也许克里金法不适用于这种多样化的价值?
我得到了一些带有标本数量的数据,并要求使用克里金法对其进行插值。
经过一些调查,似乎克里金法结果(在ArcGIS Geostatistical Analyst中使用默认参数执行)不令人满意。内插值与测量值(尤其是顶部值)相差很大,并且表面看起来不可靠。这是图片:
我想主要问题是样本数量不足。
我们应该使用多少点来获得可靠的结果?
也许克里金法不适用于这种多样化的价值?
Answers:
当您使用“默认值”时,您并不是真正的克里金,只是在应用克里金算法-正如您所发现的那样,当与这些数据一起使用时效果不佳。
(我将简要介绍一下肥皂盒:我认为,使用计算机程序获得不良结果的最快方法是接受其默认参数。ArcGIS是获得不良结果的最丰富,功能最强大的环境之一方法。这个教训是不直到你明白如何控制它使用的软件为重要的工作。从现在的肥皂盒了下来...)
为了使克里金法工作,您必须对称为“变异函数”的数据进行深入的初步统计分析。最终效果如何取决于数据以及您的地统计学技能。(已经撰写了有关变异学的全部书籍,包括Journel&Huijbregts 的开创性的Mining Geostatistics和Yvan Pannatier 的开创性的Variowin。)尽管人们成功地将最少七个数据点进行了克里格制(在US EPA出版的Robert Jernigan的专着中, 1980年代后期),并且原则上您可以只使用两三个点进行克里格法(我已经这样做来演示算法),文献中的经验法则范围从最小20点到100点,并且共识 似乎是30点左右。
在您的情况下-尽管您没有描述数据-但存在一些明显的问题,包括高度偏斜的分布和明显缺乏平稳性的证据。这些需要特殊的统计处理或特殊形式的克里金法(例如空间广义线性模型)。克里格(trigger)此类数据之前,除非拥有大量数据,否则您将无法获得良好的结果。
图例表明您可能正在尝试创建一个密度网格,而不是实际对数据进行插值:尽管这两个过程的输出可能看起来相同,但是它们做的事情截然不同,并且具有不同的解释。当数据被视为来自某个假设的连续曲面的样本时,您将进行插值。插值可预测未采样的值。标准示例包括海拔测量(对地球表面进行采样)和温度测量(对“温度场”进行采样)。当您获得有关数量的完整信息时,便可以计算密度您希望代表每单位面积该金额的平滑版本。(与插值法相反,没有任何未采样的值可以预测。)标准示例是人口密度:数据是一个区域内所有个体的计数;只有一个区域内的所有个体都在此计数。输出是人口密度图。
有两个独立的问题,首先是用于估计/建模方差图的数据位置的数量,其次是在克里金方程中用于在非数据位置插值(或估计平均值)的数据位置的数量在一个区域上)。假设您使用的是移动搜索邻域,则邻域中超过15-20个数据位置可能会降低结果的质量,因为(1)仅搜索邻域中最近的数据位置的权重将为非零,(2)包含更多数据在这种情况下,要倒置的矩阵的尺寸较大,并且病态矩阵的可能性增加。克里金法所需的数据位置总数取决于要插值的位置数目以及这些点以及数据位置的空间模式。简而言之,
关于估计/建模方差图,这是一个非常不同的问题,请参见例如
1991年,迈尔斯(DE)迈尔斯,《关于第一个国际米兰会议录的方差估计》。Conf。统计 Comp。,切什梅,土耳其,
1987年3月30日至4月2日,第二卷,美国科学出版社,261-281
1987年,A。Warrick和DE Myers,优化方差图计算的采样位置水资源研究23,496-500
这些可以从www.u.arizona.edu/~donaldm下载