Answers:
我相信您在谈论LZ自适应算法。之所以称其为冗余是因为在构建zip文件的过程中有任何重复的内容。该术语来自这种压缩方法的工作方式。
为了说明,这是一个例子。假设我有一个包含以下内容的文档:
It is what it is because that's what it is
如果我想通过冗余使这个短语更短,我首先要制作一个包含所有重复单词的字典,就像这样
1it
2is
3what
然后我将句子改写为
12312becausethats312
如果要进一步压缩,可以将以下内容添加到字典中:
312x
12y
这样就变成了
yxbecausethatsx
如您所见,您进行的冗余检查越多,压缩量就越大。但是,您也增加了腐败的可能性。这是因为随着字典的增长,它变得更容易损坏,并且如果字典的任何部分受到损坏,其余部分将无法读取。