经判断的约束,我相信你想提出一个不同的问题...或者你只是没有说明如何采取的“平均”。所以我都会回答。这两个问题的答案是否定的。H(p)≤…≤H(p)+1
首先,如果您使用代码字的均匀分布定义平均代码长度,并以作为任一元素的概率上限,则考虑长度q + k的代码,其中2 q − 1个代码字的长度为q其余2 q + k - 1的长度为q + k。对于此代码完美编码的分布,平均长度接近q + k,除非您对一个元素的概率也有下限,而熵为2−qq+k2q−1q2q+k−1q+kq+k。q+k2
现在让我们考虑“平均长度”,它是指使用霍夫曼码对进行编码时的平均码字长度。这里,结合的很紧,并且示例分布在极限实现它是其中的每个元素的概率发生2 q ± 1 / 2为q ∈ ž。(为最后一个元素分配了任何剩余概率,但是它不会渐近地产生任何区别)。p2q±1/2q∈Z.
例如,考虑然后q=7.
得到甲=52,乙=76。我们的分布具有52个元素的概率2 - 6.5,76与概率2 - 7.5,和一个元件得到剩菜。A+B=128,A2–√+B/2–√≤128,maxA∈ZAA=52,B=76522−6.5762−7.5
H(X)=(52⋅6.5+76⋅7.5)/128=7.09375(52⋅0.5−76⋅0.5)/128≈0.99436QD(P∥Q)=∑pilogpiqi+∑(1−pi)log1−pi1−qi。几天前,我发现使用它会导致切尔诺夫双面边界更紧密,如您在Wikipedia上看到的切尔诺夫边界。)