您如何比较两个高斯过程?


14

Kullback-Leibler散度是用于比较两个概率密度函数的度量,但是使用什么度量来比较两个GP的和?X XÿY


d(X,Y)=E[supt|X(t)Y(t)|]d(X,Y)=E[supt|X(t)Y(t)|]

@Zen:如果您有时间,我想进一步了解该距离指标。
尼尔·G

嗨,尼尔。我对此不太了解。请看下面我的回答。
禅宗

Answers:


8

请注意,高斯过程是多元高斯对可能无限的扩展。因此,您可以通过对进行积分来使用GP概率分布之间的KL散度:XRXRXXRXRX

DKL(P|Q)=RXlogdPdQdP.

DKL(P|Q)=RXlogdPdQdP.

通过根据过程的GP分布重复采样过程,可以使用MC方法在离散用数值近似地表示此数量。我不知道收敛速度是否足够好...XX

请注意,如果用是有限的,那么您会退回到多元正态分布的通常KL散度: XX|X|=n|X|=nDKL(GP(μ1,K1),GP(μ2,K2))=12(tr(K12K1)+(μ2μ1)K12(μ2μ1)n+log|K2||K1|)

DKL(GP(μ1,K1),GP(μ2,K2))=12(tr(K12K1)+(μ2μ1)K12(μ2μ1)n+log|K2||K1|)

我如何计算您提到的两个均值(mu1和mu2)。还是我应该像往常一样将它们等于零进行高斯过程?
Marat Zakirov,

4

请记住,如果X:T×ΩRX:T×ΩR是一个高斯过程均值函数和协方差函数ķ,然后,对于每1... ķŤ,随机矢量X t 1X t k具有多元正态分布,均值向量为m t 1m t kmKt1,,tkT(X(t1),,X(tk))和协方差矩阵 Σ = σ Ĵ= ķ Ĵ,在这里,我们使用了通用缩写 X = X (m(t1),,m(tk))Σ=(σij)=(K(ti,tj))X(t)=X(t,)

每个实现X ω 是实函数,其结构域是索引集合 Ť。假设 Ť = [ 0 1 ]。给定两个高斯过程 X Y,两个实现 X X(,ω)TT=[0,1]XYω Y X(,ω)ω SUP [ 0 1 ] | X t ω Y t ω | 。因此,将两个过程 X Y之间的距离定义为 d X Y = E似乎很自然。Y(,ω)supt[0,1]|X(t,ω)Y(t,ω)|XY[ SUP [ 0 1 ] | X t Y t | ] 我不知道该距离是否存在解析表达式,但我相信您可以按以下方式计算蒙特卡洛近似值。修正了一些细网格 0 1 < < ķ1,并得出样本X 1... X ķÝ 1... ÿ ķ从正常随机向量X t 1

d(X,Y)=E[supt[0,1]|X(t)Y(t)|].()
0t1<<tk1(xi1,,xik)(yi1,,yik)X t kY t 1Y t k,对于 i = 1 N。约 d X Y 1(X(t1),,X(tk))(Y(t1),,Y(tk))i=1,,Nd(X,Y)Ñ Ñ Σ=1最大值1Ĵķ| xijyij|
1Ni=1Nmax1jk|xijyij|.

您如何从每个向量采样?如果仅在每个GP中对均值进行抽样,则不会考虑方差。否则,您将不得不设计一种一致的采样技术。
pushkar

这是一个很好的资源:gaussianprocess.org/gpml/chapters
Zen

:您还可以阅读所有的答案,这个问题stats.stackexchange.com/questions/30652/...

请注意,由于d X X 0 所以这不是距离。由于KL比较两个分布和不两种实现,Zen的两个GPS之间的距离应该被定义为d g ^ 1G ^ 2= Ë X ģ 1ÿ ģ 2 [ SUP | X t Y t | ],和我们有Ë X d(X,X)0ÿ g ^ SUP 牛逼| XtYt | >0对于非简并高斯过程ģ
Emile 2015年

@Emile:使用定义d X X 0怎么办?
2015年
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.