将字符串打印为十六进制字节？

155

我有这个字符串：Hello world !!我想使用Python作为打印它48:65:6c:6c:6f:20:77:6f:72:6c:64:20:21:21。

hex() 仅适用于整数。

如何做呢？

如果仅返回两位数的十六进制值，则此问题暗示使用字节字符串（即Python 2 str或Python 3 bytestring），因为没有明确的字符转换为0…255之间的整数。因此，字符串（Python 2 unicode和Python 3 str）首先需要某种编码，然后才能以这种十六进制格式转换。亚伦·霍尔的答案就说明了这一点。

— Eric O Lebigot

227

您可以将字符串转换为int生成器，对每个元素应用十六进制格式，并使用分隔符插入：

>>> s = "Hello world !!"
>>> ":".join("{:02x}".format(ord(c)) for c in s)
'48:65:6c:6c:6f:20:77:6f:72:6c:64:20:21:21

— 费多尔·戈戈列夫
source

3

请注意，在python3中，将a打印str为十六进制的概念没有任何意义。您将需要将bytes对象打印为十六进制（通过调用转换str为）。bytes.encode()

— mic_e 2015年

8

事实上，这将产生在python3无效的输出：":".join("{:02x}".format(ord(c)) for c in 'løl')回报'6c:f8:6c'，而":".join("{:02x}".format(c) for c in 'løl'.encode())产生正确UTF-8表示'6c:c3:b8:6c'。

— mic_e 2015年

2

这种问答方式假定您的输入中永远不包含非ASCII字符。如果你的输入可能包含的东西像表情符号，或者非拉丁基于书面方式的系统，你可能需要使用":".join("{:04x}".format(ord(c)) for c in s)（替换02x用04x零垫每个数字是4位），而不是

— 鲍里斯·

@mic_e为什么？当您在嵌入式解释器中尝试使用Scapy时，会对此进行引用。WARNING: Calling str(pkt) on Python 3 makes no sense!

— sherrellbc

157

':'.join(x.encode('hex') for x in 'Hello World!')

— Esthete
source

3

如何在python3中做到这一点？

— h__

6

@hyh：每隔两个十六进制数字h = binascii.hexlify(b"Hello world !!") to get hex string. b":".join(h[i:i+2] for i in range(0, len(h), 2))插入':'一次。

— jfs

2

在Python 3上不起作用LookupError: 'hex' is not a text encoding; use codecs.encode() to handle arbitrary codecs

— Boris

55

对于Python 2.x：

':'.join(x.encode('hex') for x in 'Hello World!')

上面的代码不适用于Python 3.x，对于3.x，下面的代码将起作用：

':'.join(hex(ord(x))[2:] for x in 'Hello World!')

— 胡凯文
source

1

还应注意，后者还将与python2.x一起使用，并且还将适用于非ascii字符

— raudi

1

但也请注意，后者不填充前导零：hex（ord（“ \ x00”））[2：]为“ 0”和“ \ x00” .encode（“ hex”）==“ 00”

— Will Daniels

3

在其他用户提供这两种解决方案几个月后，您为什么决定将其发布为新答案？如果要弄清楚版本兼容性，那么建议对现有答案进行编辑将更有意义。

— 航空

2

正如其他地方所指出的，一旦人们超越了ASCII并考虑使用Unicode，这个答案甚至是不正确的。'：'。join（hel（ord（x））[2：] for'løl'中的x）错误地打印了'6c：f8：6c'，而正确的输出是'6c：c3：b8：6c'。

— mcduffee

23

两行中的另一个答案可能使某些人更容易阅读，并且有助于调试字符串中的换行符或其他奇数字符：

对于Python 2.7

for character in string:
    print character, character.encode('hex')

对于Python 3.7（未在3的所有版本上进行测试）

for character in string:
    print(character, character.encode('utf-8').hex())

— 谷轮3300
source

从Python 3.6.8起（至少），该功能不起作用：“ hex”不是字符串的编码。codecs.encode(<bytestring>, "hex")确实可以。

— Eric O Lebigot

2

啊，非常感谢您提供的信息...是的，这肯定是为Python 2.7编写的。我将更新答案，以包括针对Python 3.7的操作方法。

— copeland3300

经查实，Python的3.7.6：import sys; s="Déjà vu Besançon,Lupiñén,Šiauliai,Großräschen,Łódź,Аша,广东省,LA"; for c in s:; w=sys.stdout.write(c+":"+c.encode('utf-8').hex()+"||"); （out）

D:44||é:c3a9||j:6a||à:c3a0|| :20||v:76||u:75|| :20||B:42||e:65||s:73||a:61||n:6e||ç:c3a7||o:6f||n:6e||,:2c||L:4c||u:75||p:70||i:69||ñ:c3b1||é:c3a9||n:6e||,:2c||Š:c5a0||i:69||a:61||u:75||l:6c||i:69||a:61||i:69||,:2c||G:47||r:72||o:6f||ß:c39f||r:72||ä:c3a4||s:73||c:63||h:68||e:65||n:6e||,:2c||Ł:c581||ó:c3b3||d:64||ź:c5ba||,:2c||А:d090||ш:d188||а:d0b0||,:2c||广:e5b9bf||东:e4b89c||省:e79c81||,:2c||L:4c||A:41||

— bballdave025

20

Fedor Gogolev答案的一些补充：

首先，如果字符串包含“ ASCII码”低于10的字符，则不会按要求显示它们。在这种情况下，正确的格式应为{:02x}：

>>> s = "Hello unicode \u0005 !!"
>>> ":".join("{0:x}".format(ord(c)) for c in s)
'48:65:6c:6c:6f:20:75:6e:69:63:6f:64:65:20:5:20:21:21'
                                           ^

>>> ":".join("{:02x}".format(ord(c)) for c in s)
'48:65:6c:6c:6f:20:75:6e:69:63:6f:64:65:20:05:20:21:21'
                                           ^^

其次，如果您的“字符串”实际上是“字节字符串”-并且由于区别在Python 3中很重要-您可能更喜欢以下内容：

>>> s = b"Hello bytes \x05 !!"
>>> ":".join("{:02x}".format(c) for c in s)
'48:65:6c:6c:6f:20:62:79:74:65:73:20:05:20:21:21'

请注意，由于字节对象被定义为“范围在0 <= x <256之间的不可变整数序列”，因此不需要在上面的代码中进行转换。

— 西尔万·勒鲁
source

11

将字符串打印为十六进制字节？

接受的答案给出：

s = "Hello world !!"
":".join("{:02x}".format(ord(c)) for c in s)

返回：

'48:65:6c:6c:6f:20:77:6f:72:6c:64:20:21:21'

只要您使用字节（主要是ascii字符），可接受的答案就起作用。但是，如果您使用unicode，例如：

a_string = u"Привет мир!!" # "Prevyet mir", or "Hello World" in Russian.

您需要以某种方式转换为字节。

如果您的终端不接受这些字符，则可以从UTF-8解码或使用名称（以便可以与我一起粘贴并运行代码）：

a_string = (
    "\N{CYRILLIC CAPITAL LETTER PE}"
    "\N{CYRILLIC SMALL LETTER ER}"
    "\N{CYRILLIC SMALL LETTER I}"
    "\N{CYRILLIC SMALL LETTER VE}"
    "\N{CYRILLIC SMALL LETTER IE}"
    "\N{CYRILLIC SMALL LETTER TE}"
    "\N{SPACE}"
    "\N{CYRILLIC SMALL LETTER EM}"
    "\N{CYRILLIC SMALL LETTER I}"
    "\N{CYRILLIC SMALL LETTER ER}"
    "\N{EXCLAMATION MARK}"
    "\N{EXCLAMATION MARK}"
)

因此，我们看到：

":".join("{:02x}".format(ord(c)) for c in a_string)

退货

'41f:440:438:432:435:442:20:43c:438:440:21:21'

不良/意外的结果-这些代码点结合在一起，构成了来自Unicode联盟的Unicode 字形，代表了全世界的语言。但是，这并不是我们实际存储此信息的方式，因此可以由其他来源对其进行解释。

为了允许另一个源使用此数据，我们通常需要转换为UTF-8编码，例如，将该字符串以字节为单位保存到磁盘或发布为html。因此，我们需要进行编码以将代码点转换为UTF-8 的代码单元 -在Python 3中ord是不需要的，因为bytes整数是可迭代的：

>>> ":".join("{:02x}".format(c) for c in a_string.encode('utf-8'))
'd0:9f:d1:80:d0:b8:d0:b2:d0:b5:d1:82:20:d0:bc:d0:b8:d1:80:21:21'

或者，也许更优雅地使用新的f字符串（仅在Python 3中可用）：

>>> ":".join(f'{c:02x}' for c in a_string.encode('utf-8'))
'd0:9f:d1:80:d0:b8:d0:b2:d0:b5:d1:82:20:d0:bc:d0:b8:d1:80:21:21'

在Python 2中，请c转到ord第一个，即ord(c)-更多示例：

>>> ":".join("{:02x}".format(ord(c)) for c in a_string.encode('utf-8'))
'd0:9f:d1:80:d0:b8:d0:b2:d0:b5:d1:82:20:d0:bc:d0:b8:d1:80:21:21'
>>> ":".join(format(ord(c), '02x') for c in a_string.encode('utf-8'))
'd0:9f:d1:80:d0:b8:d0:b2:d0:b5:d1:82:20:d0:bc:d0:b8:d1:80:21:21'

— 亚伦·霍尔
source

1

@ not2qubit，请重试这些示例-我花了一些时间来解决Python 2和3之间的差异，显然我最初只为Python 2编写了这些。感谢质量检查人员的回答！

— 亚伦·霍尔

是的，做到了。谢谢！

— not2qubit

8

您可以使用hexdump的

import hexdump
hexdump.dump("Hello World", sep=":")

（.lower()如果需要小写，请附加）。这适用于Python 2和3。

— 托比亚斯·基恩泽（Tobias Kienzler）
source

这也是我遇到的一个问题，如果您由于安装了代理设置而无法安装hexdump或任何其他软件包，请尝试使用代理选项运行pip pip install -U hexdump --proxy http://proxy.address:port

— Eduard Florinescu 2015年

实际上，我犯了使用sudowith 的错误pip，这弄糟了pacman……

— Tobias Kienzler 2015年

6

使用map和lambda函数可以生成一个十六进制值列表，可以将其打印（或用于其他目的）

>>> s = 'Hello 1 2 3 \x01\x02\x03 :)'

>>> map(lambda c: hex(ord(c)), s)
['0x48', '0x65', '0x6c', '0x6c', '0x6f', '0x20', '0x31', '0x20', '0x32', '0x20', '0x33', '0x20', '0x1', '0x2', '0x3', '0x20', '0x3a', '0x29']

— 布伦丹·西蒙（BrendanSimon）
source

[hex(ord(c)) for c in s]

— 鲍里斯（Boris）

2

这可以通过以下方式完成：

from __future__ import print_function
str = "Hello World !!"
for char in str:
    mm = int(char.encode('hex'), 16)
    print(hex(mm), sep=':', end=' ' )

此输出将为十六进制，如下所示：

0x48 0x65 0x6c 0x6c 0x6f 0x20 0x57 0x6f 0x72 0x6c 0x64 0x20 0x21 0x21

— 甘沙姆
source

我在哪里找到未来

— tofutim

供将来参考，__future__是在Python 2的最新版本中可用的标准库，该库可用于通常仅在Python 3向后兼容的情况下制作功能。在此答案中，它用于获取print(text)“打印功能”功能，该功能取代了print textPython 2 的语法。请参见Python docs。

— 埃里克·里德

2

对于那些不关心Python3或冒号的人来说，更通用一些：

from codecs import encode

data = open('/dev/urandom', 'rb').read(20)
print(encode(data, 'hex'))      # data

print(encode(b"hello", 'hex'))  # string

— 格林哥·萨瓦（Gringo Suave）
source

0

base64.b16encode在python2中使用（内置）

>>> s = 'Hello world !!'
>>> h = base64.b16encode(s)
>>> ':'.join([h[i:i+2] for i in xrange(0, len(h), 2)]
'48:65:6C:6C:6F:20:77:6F:72:6C:64:20:21:21'

— 希普鲁·莫卡丁
source

这行不通。您在导入时使用.decode()什么，为什么不使用？

— not2qubit

0

为了方便起见，非常简单。

def hexlify_byteString(byteString, delim="%"):
    ''' very simple way to hexlify a bytestring using delimiters '''
    retval = ""
    for intval in byteString:
        retval += ( '0123456789ABCDEF'[int(intval / 16)])
        retval += ( '0123456789ABCDEF'[int(intval % 16)])
        retval += delim
    return( retval[:-1])

hexlify_byteString(b'Hello World!', ":")
# Out[439]: '48:65:6C:6C:6F:20:57:6F:72:6C:64:21'

— 伯恩·施密特
source

0

对于性能比更高的东西''.format()，您可以使用以下代码：

>>> ':'.join( '%02x'%(v if type(v) is int else ord(v)) for v in 'Hello World !!' )
'48:65:6C:6C:6F:20:77:6F:72:6C:64:20:21:21'
>>> 
>>> ':'.join( '%02x'%(v if type(v) is int else ord(v)) for v in b'Hello World !!' )
'48:65:6C:6C:6F:20:77:6F:72:6C:64:20:21:21'
>>>

抱歉，
如果一个人可以简单地做到'%02x'%v这一点，那就再好不过了，但这只需要int ...，
但是您会被字节字符串所困扰，b''而没有选择逻辑ord(v)。

— c
source