可逆十六进制转储实用程序(又名xxd)


12

xxd是与捆绑在一起的实用程序,vim已用于对该网站上的高尔夫问题代码进行编码。它将二进制文件转换为十六进制转储,然后再次返回。

以您选择的编程语言实现xxdxxd -r命令。评分基于以下条件的字符/字节长度:a)您的程序,b)在模式之间切换组合程序所必需的任何命令行参数(不需要-r)。与高尔夫一样,分数越低越好。

  • 对于两个单独的程序:正向代码 + 反向代码
  • 对于组合程序:组合代码 + sum(正向参数)+ sum(反向参数)-2

所选xxd子集的规格

正向命令(例如 xxd)接受0≤ Ñ ≤2 16从标准输入字节,并产生小区(Ñ / 16)以下面的格式(所有十六进制数字小写)标准输出的行:

  • 第一个编码字节的偏移量(格式字符串"%07x:");结束于"0"
  • 最多16个十六进制编码的字节,成对分组(格式字符串" %02x"为偶数字节,"%02x"奇数字节),并用空格右填充42个字符
  • 编码的字节被解释为ASCII字符,其值不介于0x20和0x7e('\40''\176')之间,包括"."
  • 换行符("\n""\r\n"标准输出为二进制模式时允许;)

最少的非实现C实现:

#include <stdio.h>
int main() {
    unsigned char L[16];
    int t = 0, n, i, s;

    for (; (n = fread(L, 1, 16, stdin)); t += n) {
        printf("%07x:", t);
        s = 42;
        for (i = 0; i < n; i++)
            s -= printf(i & 1 ? "%02x" : " %02x", L[i]);
        printf("%*s", s, "");
        for (i = 0; i < n; i++)
            putchar(L[i] > '\37' && L[i] < '\177' ? L[i] : '.');
        printf("\n");
    }

    return 0;
}

反向命令(例如 xxd -r)接受前向命令的任何未修改的输出(给出该命令的有效输入)并产生该原始输入。

用法示例

$ xxd < /dev/null | wc -c
0
$ php -r 'echo join(range("\0",~"\0"));' | xxd
0000000: 0001 0203 0405 0607 0809 0a0b 0c0d 0e0f  ................
0000010: 1011 1213 1415 1617 1819 1a1b 1c1d 1e1f  ................
0000020: 2021 2223 2425 2627 2829 2a2b 2c2d 2e2f   !"#$%&'()*+,-./
0000030: 3031 3233 3435 3637 3839 3a3b 3c3d 3e3f  0123456789:;<=>?
0000040: 4041 4243 4445 4647 4849 4a4b 4c4d 4e4f  @ABCDEFGHIJKLMNO
0000050: 5051 5253 5455 5657 5859 5a5b 5c5d 5e5f  PQRSTUVWXYZ[\]^_
0000060: 6061 6263 6465 6667 6869 6a6b 6c6d 6e6f  `abcdefghijklmno
0000070: 7071 7273 7475 7677 7879 7a7b 7c7d 7e7f  pqrstuvwxyz{|}~.
0000080: 8081 8283 8485 8687 8889 8a8b 8c8d 8e8f  ................
0000090: 9091 9293 9495 9697 9899 9a9b 9c9d 9e9f  ................
00000a0: a0a1 a2a3 a4a5 a6a7 a8a9 aaab acad aeaf  ................
00000b0: b0b1 b2b3 b4b5 b6b7 b8b9 babb bcbd bebf  ................
00000c0: c0c1 c2c3 c4c5 c6c7 c8c9 cacb cccd cecf  ................
00000d0: d0d1 d2d3 d4d5 d6d7 d8d9 dadb dcdd dedf  ................
00000e0: e0e1 e2e3 e4e5 e6e7 e8e9 eaeb eced eeef  ................
00000f0: f0f1 f2f3 f4f5 f6f7 f8f9 fafb fcfd feff  ................
$ xxd <<< 'The quick brown fox jumps over the lazy dog.'
0000000: 5468 6520 7175 6963 6b20 6272 6f77 6e20  The quick brown 
0000010: 666f 7820 6a75 6d70 7320 6f76 6572 2074  fox jumps over t
0000020: 6865 206c 617a 7920 646f 672e 0a         he lazy dog..
$ xxd <<< 'The quick brown fox jumps over the lazy dog.' | xxd -r
The quick brown fox jumps over the lazy dog.

反向模式是否应该忽略不正确的ASCII字符?(FWIW实际上是xxd所做的,这非常有用)。
彼得·泰勒

@PeterTaylor:反向模式仅适用于未修改的十六进制转储(从0000000开始,小写的十六进制数字,所有行中的16个字节,但最后一行,没有空格),并且不需要输入验证。就是说,忽略右边的16个字符的“ ASCII”列可能很有意义,因为它不能用于区分“”。和不可打印的字符。
PleaseStand

Answers:


3

Perl,122 + 54 = 176122 + 45 = 167

转发脚本:

$/=$,;for(<>=~/.{1,16}/gs){$h="";$h.=sprintf"%*s%02x",++$m%2,"",ord for/./gs;
s/[^ -~]/./g;printf"%06x0:%-42s",$n++,$h;say}

以及相反的脚本:

/:(.+?)  /,print map{chr hex}$1=~/\w\w/gfor<>

(这一点很有趣;如果您不注意的话,根据输入,可能会在反向脚本中显示各种晦涩的错误。)


由于$1已知仅包含十六进制数字和空格,因此您不能使用/\w\w/代替/[0-9a-f]{2}/吗?
尼尔

$1除十六进制数字和空格外,还包含许多其他内容。
面包箱

在该示例中,我仅看到和之间的十六进制数字和空格:
尼尔

(任何人都知道如何在注释降价中生成两个等宽空间吗?)
Neil

@Neil没关系,我误读了自己的代码。我现在不记得为什么我不只是使用/\w\w/。似乎很明显,我觉得我一定有原因,但我看不到任何原因。我最好的猜测是,它是试图避免需要初始正则表达式的版本的保留。
面包箱
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.