为gzip文件编写一个压缩工具


11

这项挑战的任务如下:

编写一个程序,从stdin或其他任何地方(无论您喜欢什么,但不能对其进行硬编码)读取一个合理大小的文件(例如<16 MB),并将压缩后的输出放到stdout上。输出必须是有效的gzip压缩文件,并且如果该压缩文件通过gunzip运行,则它应产生与以前完全相同的文件。

规则

  • 比赛开始之前必须知道所使用的编程语言
  • 程序的分数是源代码或汇编程序的字符数(以较短者为准)
  • 您不得使用任何现有的压缩库。
  • 玩得开心!

2
是否允许使用内置库?
hallvabo 2011年

@hallvabo:不。忘了这个 Thx
FUZxxl

2
可能最好的方法是在每个块的开始处用“以下块未压缩”标记填充输入。
Anon。

gzip是一种编程语言。虽然不是图灵完整的。
亚历山德鲁

1
这与“ 枪支和拉链”问题几乎相同。除非他们想使用codegolf.com不支持的语言(例如GolfScript)来解决问题,否则为什么有人在这里而不是在codegolf.com上发布答案。
克里斯·杰斯特·杨

Answers:


10

C#(534个字符)

using System.IO;using B=System.Byte;class X{static void Main(string[]a){var f=File.ReadAllBytes(a[0]);int l=f.Length,i=0,j;var p=new uint[256];for(uint k=0,r=0;k<256;r=++k){for(j=0;j<8;j++)r=r>>1^(r&1)*0xedb88320;p[k]=r;}uint c=~(uint)0,n=c;using(var o=File.Open(a[0]+".gz",FileMode.Create)){o.Write(new B[]{31,139,8,0,0,0,0,0,4,11},0,10);for(;i<l;i++){o.Write(new B[]{(B)(i<l-1?0:1),1,0,254,255,f[i]},0,6);c=p[(c^f[i])&0xFF]^c>>8;}c^=n;o.Write(new[]{(B)c,(B)(c>>8),(B)(c>>16),(B)(c>>24),(B)l,(B)(l>>8),(B)(l>>16),(B)(l>>24)},0,8);}}}

更具可读性:

using System.IO;
using B = System.Byte;
class X
{
    static void Main(string[] a)
    {
        // Read file contents
        var f = File.ReadAllBytes(a[0]);
        int l = f.Length, i = 0, j;

        // Initialise table for CRC hashsum
        var p = new uint[256];
        for (uint k = 0, r = 0; k < 256; r = ++k)
        {
            for (j = 0; j < 8; j++)
                r = r >> 1 ^ (r & 1) * 0xedb88320;
            p[k] = r;
        }

        uint c = ~(uint) 0, n = c;

        // Write the output file
        using (var o = File.Open(a[0] + ".gz", FileMode.Create))
        {
            // gzip header
            o.Write(new B[] { 31, 139, 8, 0, 0, 0, 0, 0, 4, 11 }, 0, 10);
            for (; i < l; i++)
            {
                // deflate block header plus one byte of payload
                o.Write(new B[] { (B) (i < l - 1 ? 0 : 1), 1, 0, 254, 255, f[i] }, 0, 6);
                // Compute CRC checksum
                c = p[(c ^ f[i]) & 0xFF] ^ c >> 8;
            }
            c ^= n;
            o.Write(new[] {
                // CRC checksum
                (B) c, (B) (c >> 8), (B) (c >> 16), (B) (c >> 24),
                // original file size
                (B) l, (B) (l >> 8), (B) (l >> 16), (B) (l >> 24)
            }, 0, 8);
        }
    }
}

评论:

  • 期望将文件路径作为第一个命令行参数。

  • 输出文件是输入文件+ .gz

  • 我没有使用任何库来执行gzip,deflate或CRC32。全部都在那里。

  • 这个“压缩器”将文件大小增加了6倍。但是它是有效的gzip格式!

  • 使用GNU gunzip和WinRAR进行了测试。

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.