在共同典型集合的定义中(在“信息论的元素”,第7.6章,第195页)中,我们使用
作为序列的经验熵,其中。我以前从未遇到过这种术语。根据书的索引,没有在任何地方明确定义它。
我的问题基本上是:为什么经验熵不是其中是经验分布?
这两个公式之间最有趣的区别和相似之处是什么?(就他们共享/不共享的属性而言)。
这两个表达式在代数上不相等吗?
—
ub
@whuber:不,我相信它们的数量不同,用途不同。注意,第一个使用假定先验已知的真实度量。第二个没有。
—
主教2012年
前者关注的是熵随时间的累积以及如何与系统的真实熵进行比较。SLLN和CLT可以很好地说明其行为。第二个问题涉及从数据估计熵,它的某些属性也可以通过上述相同的两个工具获得。但是,尽管第一个不带偏见,但第二个不小于。如果有帮助,我可以填写一些详细信息。
—
主教
@cardinal:如果您要提供以上评论作为答案(也许还解释一下SLLN和CLT是什么?-我不知道这些)我很乐意
—
投票
好的,我稍后会尝试发布更多内容。同时,SLLN =“大数的强定律”和CLT =“中央极限定理”。这些是相当标准的缩写,您可能会再次遇到。干杯。:)
—
主教