我有这个字符串:Hello world !!
我想使用Python作为打印它48:65:6c:6c:6f:20:77:6f:72:6c:64:20:21:21
。
hex()
仅适用于整数。
如何做呢?
我有这个字符串:Hello world !!
我想使用Python作为打印它48:65:6c:6c:6f:20:77:6f:72:6c:64:20:21:21
。
hex()
仅适用于整数。
如何做呢?
Answers:
您可以将字符串转换为int生成器,对每个元素应用十六进制格式,并使用分隔符插入:
>>> s = "Hello world !!"
>>> ":".join("{:02x}".format(ord(c)) for c in s)
'48:65:6c:6c:6f:20:77:6f:72:6c:64:20:21:21
str
为十六进制的概念没有任何意义。您将需要将bytes
对象打印为十六进制(通过调用转换str
为)。bytes
.encode()
":".join("{:02x}".format(ord(c)) for c in 'løl')
回报'6c:f8:6c'
,而":".join("{:02x}".format(c) for c in 'løl'.encode())
产生正确UTF-8表示'6c:c3:b8:6c'
。
":".join("{:04x}".format(ord(c)) for c in s)
(替换02x
用04x
零垫每个数字是4位),而不是
WARNING: Calling str(pkt) on Python 3 makes no sense!
':'.join(x.encode('hex') for x in 'Hello World!')
h = binascii.hexlify(b"Hello world !!") to get hex string. b":".join(h[i:i+2] for i in range(0, len(h), 2))
插入':'
一次。
LookupError: 'hex' is not a text encoding; use codecs.encode() to handle arbitrary codecs
对于Python 2.x:
':'.join(x.encode('hex') for x in 'Hello World!')
上面的代码不适用于Python 3.x,对于3.x,下面的代码将起作用:
':'.join(hex(ord(x))[2:] for x in 'Hello World!')
两行中的另一个答案可能使某些人更容易阅读,并且有助于调试字符串中的换行符或其他奇数字符:
对于Python 2.7
for character in string:
print character, character.encode('hex')
对于Python 3.7(未在3的所有版本上进行测试)
for character in string:
print(character, character.encode('utf-8').hex())
codecs.encode(<bytestring>, "hex")
确实可以。
import sys
; s="Déjà vu Besançon,Lupiñén,Šiauliai,Großräschen,Łódź,Аша,广东省,LA"
; for c in s:
; w=sys.stdout.write(c+":"+c.encode('utf-8').hex()+"||")
; (out)D:44||é:c3a9||j:6a||à:c3a0|| :20||v:76||u:75|| :20||B:42||e:65||s:73||a:61||n:6e||ç:c3a7||o:6f||n:6e||,:2c||L:4c||u:75||p:70||i:69||ñ:c3b1||é:c3a9||n:6e||,:2c||Š:c5a0||i:69||a:61||u:75||l:6c||i:69||a:61||i:69||,:2c||G:47||r:72||o:6f||ß:c39f||r:72||ä:c3a4||s:73||c:63||h:68||e:65||n:6e||,:2c||Ł:c581||ó:c3b3||d:64||ź:c5ba||,:2c||А:d090||ш:d188||а:d0b0||,:2c||广:e5b9bf||东:e4b89c||省:e79c81||,:2c||L:4c||A:41||
Fedor Gogolev答案的一些补充:
首先,如果字符串包含“ ASCII码”低于10的字符,则不会按要求显示它们。在这种情况下,正确的格式应为{:02x}
:
>>> s = "Hello unicode \u0005 !!"
>>> ":".join("{0:x}".format(ord(c)) for c in s)
'48:65:6c:6c:6f:20:75:6e:69:63:6f:64:65:20:5:20:21:21'
^
>>> ":".join("{:02x}".format(ord(c)) for c in s)
'48:65:6c:6c:6f:20:75:6e:69:63:6f:64:65:20:05:20:21:21'
^^
其次,如果您的“字符串”实际上是“字节字符串”-并且由于区别在Python 3中很重要-您可能更喜欢以下内容:
>>> s = b"Hello bytes \x05 !!"
>>> ":".join("{:02x}".format(c) for c in s)
'48:65:6c:6c:6f:20:62:79:74:65:73:20:05:20:21:21'
请注意,由于字节对象被定义为“范围在0 <= x <256之间的不可变整数序列”,因此不需要在上面的代码中进行转换。
将字符串打印为十六进制字节?
接受的答案给出:
s = "Hello world !!"
":".join("{:02x}".format(ord(c)) for c in s)
返回:
'48:65:6c:6c:6f:20:77:6f:72:6c:64:20:21:21'
只要您使用字节(主要是ascii字符),可接受的答案就起作用。但是,如果您使用unicode,例如:
a_string = u"Привет мир!!" # "Prevyet mir", or "Hello World" in Russian.
您需要以某种方式转换为字节。
如果您的终端不接受这些字符,则可以从UTF-8解码或使用名称(以便可以与我一起粘贴并运行代码):
a_string = (
"\N{CYRILLIC CAPITAL LETTER PE}"
"\N{CYRILLIC SMALL LETTER ER}"
"\N{CYRILLIC SMALL LETTER I}"
"\N{CYRILLIC SMALL LETTER VE}"
"\N{CYRILLIC SMALL LETTER IE}"
"\N{CYRILLIC SMALL LETTER TE}"
"\N{SPACE}"
"\N{CYRILLIC SMALL LETTER EM}"
"\N{CYRILLIC SMALL LETTER I}"
"\N{CYRILLIC SMALL LETTER ER}"
"\N{EXCLAMATION MARK}"
"\N{EXCLAMATION MARK}"
)
因此,我们看到:
":".join("{:02x}".format(ord(c)) for c in a_string)
退货
'41f:440:438:432:435:442:20:43c:438:440:21:21'
不良/意外的结果-这些代码点结合在一起,构成了来自Unicode联盟的Unicode 字形,代表了全世界的语言。但是,这并不是我们实际存储此信息的方式,因此可以由其他来源对其进行解释。
为了允许另一个源使用此数据,我们通常需要转换为UTF-8编码,例如,将该字符串以字节为单位保存到磁盘或发布为html。因此,我们需要进行编码以将代码点转换为UTF-8 的代码单元 -在Python 3中ord
是不需要的,因为bytes
整数是可迭代的:
>>> ":".join("{:02x}".format(c) for c in a_string.encode('utf-8'))
'd0:9f:d1:80:d0:b8:d0:b2:d0:b5:d1:82:20:d0:bc:d0:b8:d1:80:21:21'
或者,也许更优雅地使用新的f字符串(仅在Python 3中可用):
>>> ":".join(f'{c:02x}' for c in a_string.encode('utf-8'))
'd0:9f:d1:80:d0:b8:d0:b2:d0:b5:d1:82:20:d0:bc:d0:b8:d1:80:21:21'
在Python 2中,请c
转到ord
第一个,即ord(c)
-更多示例:
>>> ":".join("{:02x}".format(ord(c)) for c in a_string.encode('utf-8'))
'd0:9f:d1:80:d0:b8:d0:b2:d0:b5:d1:82:20:d0:bc:d0:b8:d1:80:21:21'
>>> ":".join(format(ord(c), '02x') for c in a_string.encode('utf-8'))
'd0:9f:d1:80:d0:b8:d0:b2:d0:b5:d1:82:20:d0:bc:d0:b8:d1:80:21:21'
您可以使用hexdump
的
import hexdump
hexdump.dump("Hello World", sep=":")
(.lower()
如果需要小写,请附加)。这适用于Python 2和3。
pip install -U hexdump --proxy http://proxy.address:port
sudo
with 的错误pip
,这弄糟了pacman
……
使用map和lambda函数可以生成一个十六进制值列表,可以将其打印(或用于其他目的)
>>> s = 'Hello 1 2 3 \x01\x02\x03 :)'
>>> map(lambda c: hex(ord(c)), s)
['0x48', '0x65', '0x6c', '0x6c', '0x6f', '0x20', '0x31', '0x20', '0x32', '0x20', '0x33', '0x20', '0x1', '0x2', '0x3', '0x20', '0x3a', '0x29']
[hex(ord(c)) for c in s]
这可以通过以下方式完成:
from __future__ import print_function
str = "Hello World !!"
for char in str:
mm = int(char.encode('hex'), 16)
print(hex(mm), sep=':', end=' ' )
此输出将为十六进制,如下所示:
0x48 0x65 0x6c 0x6c 0x6f 0x20 0x57 0x6f 0x72 0x6c 0x64 0x20 0x21 0x21
__future__
是在Python 2的最新版本中可用的标准库,该库可用于通常仅在Python 3向后兼容的情况下制作功能。在此答案中,它用于获取print(text)
“打印功能”功能,该功能取代了print text
Python 2 的语法。请参见Python docs。
对于那些不关心Python3或冒号的人来说,更通用一些:
from codecs import encode
data = open('/dev/urandom', 'rb').read(20)
print(encode(data, 'hex')) # data
print(encode(b"hello", 'hex')) # string
为了方便起见,非常简单。
def hexlify_byteString(byteString, delim="%"):
''' very simple way to hexlify a bytestring using delimiters '''
retval = ""
for intval in byteString:
retval += ( '0123456789ABCDEF'[int(intval / 16)])
retval += ( '0123456789ABCDEF'[int(intval % 16)])
retval += delim
return( retval[:-1])
hexlify_byteString(b'Hello World!', ":")
# Out[439]: '48:65:6C:6C:6F:20:57:6F:72:6C:64:21'
对于性能比更高的东西''.format()
,您可以使用以下代码:
>>> ':'.join( '%02x'%(v if type(v) is int else ord(v)) for v in 'Hello World !!' )
'48:65:6C:6C:6F:20:77:6F:72:6C:64:20:21:21'
>>>
>>> ':'.join( '%02x'%(v if type(v) is int else ord(v)) for v in b'Hello World !!' )
'48:65:6C:6C:6F:20:77:6F:72:6C:64:20:21:21'
>>>
抱歉,
如果一个人可以简单地做到'%02x'%v
这一点,那就再好不过了,但这只需要int ...,
但是您会被字节字符串所困扰,b''
而没有选择逻辑ord(v)
。
str
或Python 3bytestring
),因为没有明确的字符转换为0…255之间的整数。因此,字符串(Python 2unicode
和Python 3str
)首先需要某种编码,然后才能以这种十六进制格式转换。亚伦·霍尔的答案就说明了这一点。