Answers:
可重复的项目存储在字典中,并指定一个代码作为替代项。
这是一个过分的简化
aaaaaaaaaaaaaaaaaaaaaaaa 0001
bbbbbbbbbbbbbbbbbbbbbbbb 0002
alsdjl;asjdfkl;asdfjkljj 0003
而不是整行,只是将代码放在原处。字典越大,它可以处理的代码越多。通常,当字典变满时,它会即时启动一个新字典。当它开始一个新的代码时,它是空白的,并且新的代码被分配给检测到的模式。
通常,越大越好。整个词典都保存在内存中,因此您需要比词典大小更多的RAM。
字典的大小取决于数据的可压缩性,文件数,大小和整体大小。
通常,32mb绰绰有余,但是如果您压缩多个multi-gig文件,则可以使用更大的文件数。较大的词典通常会使处理速度变慢,但结果导致文件较小。