是否可以通过高斯过程(回归)对[a,b]上的任何连续函数(其中a和b是实数)进行近似或任意接近(在一定范数下)该函数?
是否可以通过高斯过程(回归)对[a,b]上的任何连续函数(其中a和b是实数)进行近似或任意接近(在一定范数下)该函数?
Answers:
如@Dougal所述,可以用两种不同的方式来解释您的问题。它们似乎密切相关,即使看起来并非如此。
第一种解释是:令为R d的紧凑子集(紧致性是以下所有方面的基础!!!),令k (x,x)为X × X上定义的连续协方差函数(或核),和表示具有ç (X )的连续函数的赋范空间X,配备有最大范| | ⋅ | | ∞。对于任何函数˚F ∈ Ç (X ),可以˚F通过与k相关的RKHS(再现内核希尔伯特空间)中的函数近似于预定公差。您可能很想知道RKHS是什么,这与高斯过程回归有什么关系。一个RKHS 是由所有可能的有限的线性的所有可能的功能的组合所形成的向量空间的封闭˚F ÿ(X)= ķ (X,ÿ)其中ý ∈ X。这与高斯过程回归非常严格相关,因为给定高斯过程先于G P在空间 C (X )上,那么所有可能由高斯过程回归产生的后均值空间的(封闭)就是RKHS。实际上,所有可能的后部均形式为
即,它们是函数有限线性组合。因此,我们有效地询问是否,给出的高斯过程之前ģ P (0 ,ķ (X,X))上Ç (X ),对于任何函数˚F ∈ Ç (X )总有一个函数˚F *在GPR可以生成的所有函数的(封闭)空间中,该空间尽可能接近。
对于某些特定的内核(包括经典的平方指数内核,但不包括多项式内核),答案是肯定的。可以证明,对于这样的内核是密集在Ç (X ),即,对于任何˚F ∈ Ç (X )和任何公差ε,有一个˚F *在ķ (X ),使得| | f − f ∗ | | | ∞ < ϵ。注意以下假设:是紧致的,f是连续的,k是具有所谓的通用逼近性质的连续核。有关更一般(因此很复杂)的上下文的完整证明,请参见此处。
此结果远不如乍看之下强大。即使处于GPR可以产生的后均值(封闭)空间中,对于足够大的训练集,我们还没有证明它是 GPR返回的特定后验均值,当然训练集由f在点x 1,... ,x n处的嘈杂观测值组成。对于n → ∞,我们甚至还没有证明GPR返回的后均值完全收敛!这实际上是@Dougal建议的第二种解释。在这个问题的答案取决于回答第一个问题:如果没有任何功能在RKHS这是一个“很好的近似”来˚F,我们当然不能指望后平均通过GPR收敛返回它。但是,这是一个不同的问题。如果您也想回答这个问题,请提出一个新问题。