用蒙特卡洛估计Kullback Leibler(KL)的散度


10

我想估计两个连续分布f和g之间的KL散度。但是,我无法写下f或g的密度。我可以通过某种方法(例如,马尔可夫链蒙特卡洛)从f和g中采样。

从f到g的KL散度定义如下

dķ大号F||G=-FX日志FXGXdX

这是关于f 的期望,因此您可以想象一些蒙特卡洛估计日志FXGX

1个ñ一世ñ日志FX一世GX一世

其中i索引从f提取的N个样本(即,对于i = 1,...,N,X一世F

但是,由于我不知道f()和g(),因此甚至无法使用此蒙特卡洛估计。在这种情况下估算KL的标准方法是什么?

编辑:我不知道f()或g()的非归一化密度


您是否考虑过使用ecdfs?
托比,

这会起作用,但是对于f和g的艰难选择(靠近或靠近尾巴),它可能会变慢。如果您决定忽略远离尾巴的样本,则可能会对roc的上限有更多的希望。
克里斯蒂安·查普曼

Answers:


7

我假设您可以将和评估为归一化常数。表示和。g f x = f ux / c f g x = g ux / c gfgf(x)=fu(x)/cfg(x)=gu(x)/cg

可以使用的一致估计量为 其中 是比率的重要性采样估计量。在这里,您使用和作为器乐密度和分别与目标非标准化密度的对数比。 - [R = 1 / Ñ

DKL^(f||g)=[n1jfu(xj)/πf(xj)]11NiN[log(fu(zi)gu(zi))fu(zi)πr(zi)]log(r^)
Ç˚F/çπ˚Fπ˚Füùπř
(1)r^=1/n1/ñĴFüXĴ/πFXĴĴGüÿĴ/πGÿĴ
cf/cGπFπGfügüπ[R

因此,让,和。(1)的分子收敛到。分母收敛到。该比率通过连续映射定理是一致的。通过再次连续映射,比率的对数是一致的。 { ÿ } π { ž } π [R Ç ˚F Ç {X一世}πF{ÿ一世}πG{ž一世}π[RcFCG

关于估算器的另一部分, 由大数定律决定。

1个ñ一世ñ[日志Füž一世Güž一世Füž一世π[Rž一世]CFË[日志Füž一世Güž一世]

我的动机如下:

dķ大号F||G=-FX日志FXGXdX=-FX{日志[FüXGüX]+日志[CGCF]}dX=ËF[日志FüXGüX]+日志[CGCF]=CF-1个Ëπ[R[日志FüXGüXFüXπ[RX]+日志[CGCF]
因此,我将其分解为易处理的部分。

有关如何模拟似然比的更多想法,我发现了一篇包含以下内容的论文:https ://projecteuclid.org/download/pdf_1/euclid.aos/1031594732


(+1)在这里值得注意的是,如果目标分布的尾部比您从中采样的分布更胖和/或维数全部很大,​​则重要性采样可以具有极高的方差(甚至是无限方差)。
戴维·哈里斯

@ DavidJ.Harris非常非常对
Taylor

6

在这里,我假设您只能从模型中采样;未归一化的密度函数不可用。

你写的

dķ大号F||G=-FX日志FXGX=:[RdX

在这里我将概率比定义为。Alex Smola写道,尽管在不同的上下文中,您可以通过训练分类器来“轻松”地估算这些比率。让我们假设您获得了一个分类器,它可以告诉您观察值由生成的可能性。请注意,。然后:p f | x x f p g | x = 1 p f | x [RpF|XXFpG|X=1个-pF|X

[R=pX|FpX|G=pF|XpXpGpG|XpXpF=pF|XpG|X

其中第一步归因于贝叶斯,而最后一步遵循的假设。pG=pF

获得这样的分类器可能很容易,原因有两个。

首先,您可以进行随机更新。这意味着,如果您使用的是Logistic回归或神经网络常用的基于梯度的优化器,则只需从和中提取一个样本并进行更新即可。FG

其次,由于您实际上拥有无限的数据-您只需采样和即可死亡-您不必担心过度拟合等问题。FG


0

除了@bayerj提到的概率分类器方法外,您还可以使用在[1-2]中得出的KL散度的下限:

ķ大号[FG]SUPŤ{ËXF[ŤX]-ËXG[经验值ŤX-1个]}
其中是任意的功能。在某些温和的条件下,边界对于以下条件是紧的: ŤX[R
ŤX=1个+ln[FXGX]

为了估计和之间的KL散度,我们将函数的下界wrt最大化。FGŤX

参考文献:

[1] Nguyen,X.,Wainwright,MJ和密歇根州乔丹,2010。通过凸风险最小化估计散度函数和似然比。IEEE Transactions on Information Theory,56(11),第5847-5861页。

[2] Nowozin,S.,Cseke,B.和Tomioka,R.,2016年。f-gan:使用变分散度最小化训练生成型神经采样器。神经信息处理系统的进展(第271-279页)。

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.