我见过一些高度压缩的文件,例如700MB的数据压缩到大约30-50MB。
但是你怎么得到这样的压缩文件?我曾尝试使用像WinRAR和7Zip这样的软件,但从未实现过如此高的压缩率。
有哪些技术/软件可以让您轻松压缩文件?
(P.S.我使用的是Windows XP)
我见过一些高度压缩的文件,例如700MB的数据压缩到大约30-50MB。
但是你怎么得到这样的压缩文件?我曾尝试使用像WinRAR和7Zip这样的软件,但从未实现过如此高的压缩率。
有哪些技术/软件可以让您轻松压缩文件?
(P.S.我使用的是Windows XP)
Answers:
如果压缩数据所需的时间不是问题,那么您可以通过一起使用多个不同的工具来优化压缩大小。
使用7zip,winrar(用于zip)和bjwflate等不同工具压缩数据几次。
(请注意,这并不意味着反复压缩zip文件,而是使用不同的工具创建许多替代zip文件)
接下来,运行 deflopt 在每个存档上,以减少每个存档。
最后,跑 zipmix 关于档案馆藏。由于不同的zip工具在不同的文件上更好,因此zipmix从每个档案中选择每个文件的最佳压缩版本,并产生小于任何zip工具可以单独生成的输出。
但是,您应该注意,这并不能保证您的文件可以使用任何魔法。某些类型的数据根本不能很好地压缩,如JPEG和MP3。这些文件已在内部压缩。
以前的答案是错误的一个数量级!
我个人经验的最好的压缩算法是 paq8o10t (看到 zpaq 页面和 PDF )。
提示:压缩files_or_folders的命令如下:
paq8o10t -5 archive files_or_folders
资源: 增量日记备份实用程序和存档程序
您可以在上找到源代码的镜像 GitHub上 。
一个稍好的压缩算法,并且获胜者 哈特奖 ,是decomp8(参见奖品页面上的链接)。但是,没有可以实际使用的压缩程序。
对于 真 大文件 lrzip 可以实现简单的压缩比 滑稽 。
README.benchmarks中的一个示例:
让我们把六个内核树作为tarball分开一个版本, linux-2.6.31到linux-2.6.36。这些将显示出许多冗余 信息,但相隔数百兆,lrzip将是非常 擅长压缩。为简单起见,仅比较7z 到目前为止,这是目前最好的通用压缩机:
这些是在2.53Ghz双核Intel Core2上执行的基准测试 4GB ram使用lrzip v0.5.1。请注意,它以32位运行 用户空间所以只有2GB的寻址是可行的。然而基准 使用-U选项运行,允许将整个文件视为 一个大的压缩窗口。
连续6个内核树的Tarball。
Compression Size Percentage Compress Decompress
None 2373713920 100 [n/a] [n/a]
7z 344088002 14.5 17m26s 1m22s
lrzip 104874109 4.4 11m37s 56s
lrzip -l 223130711 9.4 05m21s 1m01s
lrzip -U 73356070 3.1 08m53s 43s
lrzip -Ul 158851141 6.7 04m31s 35s
lrzip -Uz 62614573 2.6 24m42s 25m30s
Squeezechart.com 包含各种压缩率的比较。虽然,正如Nifle的答案所述 - 你不太可能获得二进制格式的高压缩率。
大多数压缩工具都有一些设置,允许您在较慢的压缩/解压缩时间和更多RAM使用率的折衷下实现更高的压缩率。
对于7-Zip,请在内置帮助中搜索“添加到存档对话框”以获取更多详细信息。
检查一下 多文件压缩基准测试的摘要 哪个有 最好的压缩列表 其中包括完整的压缩基准。
此测试中表现最佳的(基于压缩)是PAQ8和WinRK(PWCM)。他们能够将300+ Mb测试装置压缩至62 Mb以下(尺寸减小80%),但至少需要8.5小时才能完成测试。头号项目(PAQ8P)需要近12个小时,第四个项目(PAQAR)甚至需要17个小时才能完成测试。 WinRK,压缩率第二好的程序(79.7%)需要大约8.5小时。毫不奇怪,所有提到的程序都使用PAQ(类似)引擎进行压缩。如果您有包含嵌入图像的文件(例如Word DOC文件)使用PAQ8,它将识别它们并单独压缩它们,从而显着提高压缩效果。所有提到的程序(WinRK除外)都是免费的。
Nanozip 似乎与FreeArc一起具有最高压缩率。但它尚未进入最终版本。有 Nanozip实现了多么好的压缩效果 。它具有非常高的压缩性,并且不需要太多时间,请检查 多文件压缩基准测试的摘要 ,但FreeArc更快。