log(p(x,y))如何规范逐点相互信息?


9

我正在尝试理解逐点相互信息的规范化形式。

ñp一世=p一世XÿØGpXÿ

为什么对数联合概率将逐点相互信息归一化为[-1,1]之间?

逐点相互信息是:

pmi=log(p(x,y)p(x)p(y))

p(x,y)的边界是[0,1],所以log(p(x,y))的边界是(,0]。看来log(p(x,y))应该以某种方式平衡变化分子,但是我不知道怎么做,这也让我想起了熵 h=log(p(x)),但我仍然不了解确切的关系。


首先,逐点相互信息使用对数(我不确定它是否是错字或您是否使用其他数量)。
Piotr Migdal

Answers:


12

从Wikipedia上关于逐点相互信息的条目:

逐点相互信息可以在[-1,+ 1]之间进行归一化,从而使-1(在极限内)永远不会一起出现,0表示独立性,而+1表示完全共现。

为什么会发生?好吧,逐点相互信息的定义是

p一世日志[pXÿpXpÿ]=日志pXÿ-日志pX-日志pÿ

而对于归一化的逐点相互信息是:

ñp一世p一世-日志pXÿ=日志[pXpÿ]日志pXÿ-1。

什么时候有:

  • 没有共现, 日志pXÿ-,因此nmpi为-1,
  • 随机共现 日志pXÿ=日志[pXpÿ],因此nmpi为0,
  • 完全共现 日志pXÿ=日志pX=日志pÿ,因此 nmpi为1。

这将是一个更完整的答案,以显示为什么npmi处于间隔 [-1个1个]。在其他答案中查看我的证明。
汉斯(Hans)

1

尽管Piotr Migdal的答案在提供nmpi达到三个极值的示例方面很有帮助,但并不能证明它在区间上 [-1个1个]。这是不等式及其推导。

日志pXÿ日志pXÿ-日志pX-日志pÿ=日志pXÿpXpÿ=:pmiX;ÿ=日志pÿ|X+日志pÿ|X-日志pXÿ-日志pXÿ
-日志p一个0 对于任何事件 一个。双方除以非负数HXÿ:=-日志pXÿ, 我们有
-1个piX;ÿ:=mpi(x; y)HXÿ1。

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.