高斯过程已被广泛使用,尤其是在仿真中。已知计算需求很高()。
- 是什么使它们受欢迎?
- 它们的主要优势和隐藏优势是什么?
- 为什么使用它们代替参数模型(按参数模型,我指的是典型的线性回归,其中可以使用不同的参数形式来描述输入与输出趋势;例如qaudratic)?
我真的很感谢一个技术性的答案,它解释了使高斯过程独特且有利的内在属性。
高斯过程已被广泛使用,尤其是在仿真中。已知计算需求很高()。
我真的很感谢一个技术性的答案,它解释了使高斯过程独特且有利的内在属性。
Answers:
从工程的角度来看,主要优点是(如@Alexey所述)。在广泛使用的Kriging过程中,您可以根据距离和方向提供“相关”(或协方差)模型(通常称为“ 变异图椭球”)来解释自己的“空间” 。
没有什么可以阻止其他方法具有相同的功能,恰好是克里金法最初被概念化的方式对不是统计学家的人们具有友好的态度。
如今,随着基于地统计学的随机方法(例如顺序高斯模拟)的兴起,这些程序正被用于定义不确定性空间(可能需要成千上万个维度)的领域。再次,从工程学的角度来看,基于地统计学的算法非常容易包含在遗传编程中。因此,当您遇到逆向问题时,您需要能够测试多个场景并测试它们对优化功能的适应性。
让我们暂时将纯粹的论点留出一个状态,以说明此用法的现代真实示例。您可以直接采样地下样本(硬数据),也可以制作地下地震图(软数据)。
在硬数据中,您可以直接测量特性(比如说声阻抗),而不会出现(ish)误差。问题在于这是稀缺的(而且昂贵)。另一方面,您具有地震映射,该映射实际上是地下像素的体积图,但没有给您声阻抗。为了简单起见,假设它给您两个声阻抗值(顶部和底部)之间的比率。因此,比率0.5可以除以1000/2000或10000/20000。这是一个多重解决方案空间,可以使用几种组合,但是只有一种可以准确地表示现实。您如何解决呢?
顺便地震反演作品(随机过程)是通过产生合理的(这是另一个故事一起)的声阻抗(或其它性质)的情况下,变换这些情景到合成地震(如在前面的例子中的比率)和将合成地震与真实地震(相关)进行比较。最佳方案将用于产生更多方案,并融合成一个解决方案(这并不像看起来那样容易)。
考虑到这一点并从可用性的角度来讲,我将通过以下方式回答您的问题:
1) 使它们受欢迎的原因是可用性,实现的灵活性,大量的研究中心和机构,它们不断为多个不同领域(尤其是在地球科学中,包括GIS)制定更新且更适应高斯的程序。
2) 从我的角度来看,主要优势是如上所述的可用性和灵活性。如果它易于操作且易于使用,那就去做吧。高斯过程中没有没有其他方法(统计或其他方法)无法重现的特殊功能。
3) 当您需要在模型中包含的信息不仅仅包括数据时,可以使用它们(信息具有空间关系,统计分布等等)。我可以保证,如果使用克里金法,如果您有大量具有各向同性行为的数据,那是在浪费时间。您可以使用其他任何方法获得相同的结果,而这些方法所需的信息更少,运行速度更快。
对于工程师而言,重要的是:
高斯过程满足所有这些要求。
此外,工程数据和地统计数据集通常不大或具有特定的网格结构,可以快速推断。