我遇到了大量文献,他们主张将Fisher信息量度作为概率分布空间中的自然局部量度,然后对其进行积分以定义距离和体积。
但是这些“综合”数量实际上对任何事情都有用吗?我没有找到任何理论依据,也没有实际应用。一个是Guy Lebanon的作品,他使用“费舍尔的距离”对文档进行分类,另一个是罗德里格斯的“ 模型选择 ” ABC…其中“费舍尔的体积”用于模型选择。显然,使用“信息量”相对于AIC和BIC进行模型选择具有“数量级”的改进,但是我没有看到有关该工作的任何后续报道。
理论上的证明可能是拥有一个泛化边界,该泛化边界使用距离或体积的这种度量,并且比从MDL或渐近参数得出的边界更好,或者有一种依赖于这些数量之一的方法在某些合理的实际情况下可证明是更好的任何这种结果?