有界互信息在点向互信息上有界


18

假设我有两个集合和以及在这些集合的联合概率分布。令和分别表示和的边际分布。XYp(x,y)p(x)p(y)XY

和之间的相互信息定义为: XY

I(X;Y)=x,yp(x,y)log(p(x,y)p(x)p(y))

即它是点向互信息pmi的平均值。(x,y)log(p(x,y)p(x)p(y))

假设我知道pmi上限和下限:即,我知道对于所有,以下成立: -k \ leq \ log \ left(\ frac {p(x,y)} {p( x)p(y)} \右)\ leq k(x,y)x,y

klog(p(x,y)p(x)p(y))k

这意味着I(X; Y)的上限I(X;Y)。当然,这意味着I(X;Y)k,但是如果可能的话,我希望有一个更严格的界限。这在我看来是合理的,因为p定义了概率分布,并且pmi (x,y)不能针对xy的每个值取其最大值(甚至是非负数)y


1
当联合概率和边际概率统一时,pmi(xy)统一为零(因此是非负的,显然与您的最后一个声明相矛盾,只是勉强相符)。在我看来,如果我没记错的话,那么在X \ times Y的小子集上扰动这种情况就X×Y表明pmi的界限几乎没有说明I(X;Y)本身。
ub

1
实际上,如果和是独立的,则不变,而与边际分布无关。因此,有一整套分布,为每个和获得最大值。Y p m ix y p x y p m ix y x yXYpmi(x,y)p(x,y)pmi(x,y)xy
红衣主教

是的,pmi对于所有和都可以相等,这确实是对的,但是这并不排除更严格的界限。例如,不难证明。这是时,并且是结合的非平凡加强当。我想知道是否存在更平常的界限。X Ý X ; Ý ķ ë ķ - 1 ķ 2 ķ < 1 ķ ķ < 1(x,y)xyI(X;Y)k(ek1)k2k<1kk<1
Florian

1
我怀疑对于,您会得到比更好的约束。如果您想看起来更努力,请尝试根据p(x)p(y)和p(x,y)之间的KL差异重新构想您的问题。Pinsker的不等式为MI提供了下限,这可能证实了我的直觉。另请参阅ajmaa.org/RGMIA/papers/v2n4/relog.pdf的第4节。k 0O(k2)k0
vqv 2011年

Answers:


5

我的贡献包括一个例子。它说明了在给定点式互信息的范围内如何限制互信息的一些限制。

对于所有取和。对于任何令是方程式 然后,我们将点质量放置在乘积空间中的点中,这样在每一行和每一列中都有个这些点。(这可以通过多种方式完成。例如,从第一行中的前个点开始,然后通过移动填充其余行p X = 1 / Ñ X X { 1 ... ñ / 2 } ķ > 0 ë ķ + ñ - ë - ķ = Ñ e k / n 2 n m { 1 X=Y={1,,n}p(x)=1/nxXm{1,,n/2}k>0

mek+(nm)ek=n.
ek/n2nm m m m{1,,n}2mmm向右指向1,每行具有循环边界条件)。我们将点质量放在剩余的点中。这些点质量的总和为 因此它们给出了概率度量。所有边际概率都是 因此,两种边际分布都是一致的。n 2n m n mek/n2n2nm
nmn2ek+n2nmn2ek=mek+(nm)ekn=1,
mn2ek+mnn2ek=1n,

通过构造,显然对于所有和(计算) 其中互信息表现为为和作为为。pmi(x,y){k,k},x,y{1,,n}

I(X;Y)=knmn2ekkn2nmn2ek=k(1ekekek(ek+ek)ek),
k2/2k0kk


1

我不确定这是否是您要寻找的东西,因为它大多是代数的,并没有真正利用p的属性作为概率分布,但是您可以尝试以下方法。

由于pmi的界限,显然,因此。我们可以代替的,以获得p(x,y)p(x)p(y)ekp(x,y)p(x)p(y)ekp(x,y)I(X;Y)I(X;Y)x,yp(x)p(y)eklog(p(x)p(y)ekp(x)p(y))=x,yp(x)p(y)ekk

我不确定这是否有帮助。

编辑:经过进一步的审查,我认为这实际上没有k的原始上限有用。我不会删除此内容,以防它可能提示某个起点。


在您记下和(自以来)之后,此界限的值变得显而易见。x,yp(x)p(y)=1k0ek1
ub

是的,当我意识到自己进行了编辑。
Michael McGowan
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.