我正在研究一个问题,我需要使用克里金法基于周围的一些变量来预测某些变量的值。我想自己实现它的代码。因此,我阅读了太多文档以了解其工作原理,但我感到非常困惑。通常,我知道它是加权平均值,但是我无法完全理解计算权重然后预测变量值的过程。
谁能简单地向我解释这种插值方法的数学方面及其工作原理?
我正在研究一个问题,我需要使用克里金法基于周围的一些变量来预测某些变量的值。我想自己实现它的代码。因此,我阅读了太多文档以了解其工作原理,但我感到非常困惑。通常,我知道它是加权平均值,但是我无法完全理解计算权重然后预测变量值的过程。
谁能简单地向我解释这种插值方法的数学方面及其工作原理?
Answers:
这个答案包括我最近写的一篇介绍性部分,该论文描述了“ Universal Kriging”(英国)的(适度)时空扩展,该扩展本身是“普通Kriging”的适度概括。它分为三个小节:理论给出了统计模型和假设。估计简要回顾了最小二乘参数估计;和预测显示了如何克里金装配到广义最小二乘法(GLS)的框架。我已努力采用统计学家(尤其是本网站的访问者)熟悉的符号,并使用此处已充分解释的概念。
总而言之,克里金法是随机场的最佳线性无偏预测(BLUP)。 这意味着在任何未采样位置处的预测值都是在采样位置处观察到的值和协变量的线性组合获得的。那里的(未知的,随机的)值与样本值具有假定的相关性(并且样本值之间相互关联)。该相关信息易于转换为预测的方差。在预测中零偏的条件下,人们选择线性组合中的系数(“克里金权重”),使该差异尽可能小。详细信息如下。
英国包含两个程序-一个估计和另一个预测-在研究区域的GLS模型的背景下执行。GLS模型假定样本数据是趋势周围随机偏差的结果,并且这些偏差是相关的。一般而言,趋势是指可以通过未知系数(参数)的线性组合确定的值。(在本文中,素数表示矩阵转置,所有矢量均视为列矢量。)p β = (β 1,β 2,... ,β p )' '
在研究区域内的任何位置,都有一个元数值属性称为“独立变量”或“协变量”的元组。(通常是一个“常数项”,和可以是空间坐标,附加可以表示空间信息以及研究区域所有位置都可用的其他辅助信息,例如在每个数据位置,除其协变量,相关的观测值y 1 = 1 y 2 y 3 y i i y i = (y i 1,y i 2,… ,y i p)' z i Z i y 我ÿ 我ž 我被认为是随机变量的实现。相反,被认为是由观测值(数据“支持”)表示的点或小区域确定或表征的值。该不被认为是随机变量的实现和需要是无关的任何的性能。
线性组合 用参数表示的期望值,它是位置处的趋势值。估计过程使用数据查找代表未知参数值,而预测过程使用位置来计算未采样位置的值,这里索引为。估算目标是固定的(即ž 我 β我 β我β 我我=1,2,...,Ñ我=0 ž 0 ý “ 0 β0
经典克里金法假设随机波动期望值为零,并且它们的协方差是已知的。将和之间的协方差写为。使用该协方差,使用GLS执行估计。解决方案如下: 其中是观测值的向量,(“设计矩阵”)是 ×矩阵,其行是向量ž 我Ž Ĵ Ç 我Ĵ β = ħ Ž,ħ = (ý ' ç - 1 Ÿ)- 1 Ÿ ' Ç - 1 ž = (Ž 1,Ž 2,... ,Ž Ñ)ñ Ý = (ÿ 我Ĵ)ñ p Ý ' 我,1
英国类似地预测通过数据的线性组合的装置 ž 0 = λ 1 Ž 1 + λ 2 ž 2 + ⋯ + λ Ñ Ž Ñ = λ ' ž。 所述λ 我被称为用于预测的“权重克里格” ž 0。英国通过满足两个标准来完成对z 0的预测。首先,预测应该是无偏的,这通过要求随机变量的线性组合来表示
无论是多少。前提是这种情况
(熟悉多元回归的读者可能会发现将此解决方案与基于协方差的普通最小二乘方法则方程进行比较很有启发性,该方程看起来几乎完全相同,但没有Lagrange乘数项。)