对于许多相同的文件,更有效的文件压缩程序?


12

我正在备份工作,并且正在寻找可以更有效地压缩文件的程序。Windows默认的压缩程序工作正常,但它不像我想要的那样“智能”。

我的文件基本上是过去几个月中进行定期完整备份的整个工作快照。备份之间的变化不大,许多文件只是彼此的副本。

我的整个文件集大约有15GB的未压缩空间,而单个快照备份(使用标准压缩程序进行压缩)则大约有150至200MB(它们的大小通常随着更新的日期而增加)。所有压缩快照的总大小约为3GB。由于文件的性质,我希望“智能”压缩程序可以将整个卷减少到大约400-500 MB,也就是说,要考虑到合理的低效率和额外的空间来压缩文件中的差异。

是否有一个压缩程序可以利用许多文件相同的事实来实现比标准Windows压缩程序高得多的压缩率?

谢谢-法肯

编辑:刚完成使用标准Windows压缩的整个卷的最佳压缩。它仅比压缩快照的总和好10MB。我认为知道文件的性质是不可接受的。


在什么版本的Windows上?
约翰T

1
嘿,它的远景...

3
切换到版本控制而不是备份会更好吗?我还在二进制文件中使用git,它的工作原理非常好。我不认为它可以压缩到7z的水平,但是它需要150 MB还是300 MB是否重要呢?如果没有,我会追求易用性和灵活性。
maaartinus 2011年

Answers:


18

如果我没有记错的话,7-zip支持固体压缩,因此它应该很好地压缩很多几乎相同的文件。


2
+1,并考虑默认的7z格式。
nik

我会尝试的,我会尽快给您结果。

2
在最高设置下压缩1小时后,我得到了133MB的文件大小。这非常令人印象深刻!我最初的积极估计(我没有说过)是大约150MB的文件大小(这与我所说的保守估计400-500MB相对)。从现在开始,我将转换为7z!

即使您需要坚持标准的Zip格式,7-zip的产出也比其他具有最高效率设置的流行压缩工具(WinRAR,WinZip)要好。
christophem

从字面上看,7 zip是我放在新盒子上的第一个工具。太有用了。
corsiKa 2015年

6

正如问题中提到的,我使用7-zip(9.20版)对“相同文件”进行了一些测试,因为目前还没有人给出详尽的答案。这给出了一些有趣的结果。我测试了该站点用于其页面未找到消息的文件的 10个副本。此文件作为jpg文件不能很好地压缩为单个文件。因此,它将证明压缩多个相同文件的效率。文件大小为37 KB。

  1. 当我使用zip格式压缩所有十个副本时,文件大小为367 KB,压缩大小约为所有10个文件原始总大小 99%。
  2. 当我将所有十个副本压缩为7z格式时,文件大小为37 KB,压缩大小约为原始文件之一的101%。
  3. 如果我先将5个副本放入7-z档案中,然后在不同的步骤中添加3个副本,最后添加2个副本,文件大小将变为111 KB,约为单个原始文件大小的三倍。

如果打开第三个档案,则属性之一是Block。这分别为3、5和2个文件列出了0、1和2。

观察结果:

  1. zip格式将分别压缩每个文件,而无法有效地压缩相同的文件。
  2. 7z格式将有效地压缩多个相同的文件,只要将它们一步添加到存档中即可。

结论:

  1. 为了获得最佳的文件压缩效果,请使用7z而不是zip。
  2. 如果您不将文件添加到现有的7z归档中,而是先对其进行解压缩,然后一步一步压缩它(包括新文件),则压缩可能会大大改善。

1

Windows Vista附带了“ 备份和还原中心”。它将对文件进行增量备份,以避免浪费空间和创建多个备份。从链接页面:

以前备份的文件版本仅使用最少的磁盘空间。如果仅更改文件的一小部分(例如演示文稿中的一张幻灯片),则仅跟踪和保存该部分。


1

7-zip具有最好的压缩算法之一。我不相信目前为止,在压缩(算法)方面还没有任何东西能超过7-zip。

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.