有人能以纯粹的数学严格方式证明 Fisher信息量度与相对熵(或KL散度)之间的以下联系吗?
我在John Baez的漂亮博客中找到了上述内容,Vasileios Anagnostopoulos在评论中谈到了这一点。
有人能以纯粹的数学严格方式证明 Fisher信息量度与相对熵(或KL散度)之间的以下联系吗?
我在John Baez的漂亮博客中找到了上述内容,Vasileios Anagnostopoulos在评论中谈到了这一点。
Answers:
1946年,地球物理学家和贝叶斯统计学家Harold Jeffreys介绍了我们今天称为Kullback-Leibler散度的方法,发现对于两个“无限接近”的分布(希望数学SE的人看不到这一点;-),我们可以编写它们的Kullback-Leibler散度为二次形式,其系数由Fisher信息矩阵的元素给定。他将这种二次形式解释为黎曼流形长度的元素,费舍尔信息起着黎曼度量的作用。通过统计模型的这种几何化,他推导出了Jeffreys的先验信息,它是由黎曼度量自然诱发的度量,尽管一般而言,它不是有限度量,但该度量可以解释为流形上的内在均匀分布。
要编写严格的证明,您需要找出所有正则条件,并注意泰勒展开式中误差项的顺序。这是论点的简要概述。
两个密度和之间对称的Kullback-Leibler散度定义为
如果我们有一组由参数化的密度,则
这是原始文件:
杰弗里斯(1946)。估计问题中先验概率的不变形式。程序 皇家社会。伦敦,A系列,186,453–461。
Zen的答案使用对称的KL散度,但结果也适用于通常的形式,因为它对于无限相似的紧密分布变得对称。
这是由标量参数化的离散分布的证明(因为我很懒),但是可以很容易地将其重写为连续分布或参数向量: