将二进制转换为ASCII,反之亦然


82

使用以下代码获取字符串并将其转换为二进制:

bin(reduce(lambda x, y: 256*x+y, (ord(c) for c in 'hello'), 0))

输出:

0b110100001100101011011000110110001101111

如果我将其放到该站点(位于右侧站点)中,则会得到hello回我的消息。我想知道它使用什么方法。我知道我可以将二进制字符串拼接成8,然后将其与相应的值进行匹配bin(ord(character))或以其他方式进行匹配。真正在寻找更简单的东西。


1
因此,您的问题是:“与明显的方法相比,有没有更简洁的方法来对代码进行逆操作”?
2011年

1
相关:b2a_binCython中的扩展允许"01"直接从字节字符串创建二进制字符串(),而无需创建中间的Python整数。
jfs

Answers:


157

对于[ -~]Python 2范围内的ASCII字符:

>>> import binascii
>>> bin(int(binascii.hexlify('hello'), 16))
'0b110100001100101011011000110110001101111'

相反:

>>> n = int('0b110100001100101011011000110110001101111', 2)
>>> binascii.unhexlify('%x' % n)
'hello'

在Python 3.2+中:

>>> bin(int.from_bytes('hello'.encode(), 'big'))
'0b110100001100101011011000110110001101111'

相反:

>>> n = int('0b110100001100101011011000110110001101111', 2)
>>> n.to_bytes((n.bit_length() + 7) // 8, 'big').decode()
'hello'

要在Python中支持所有Unicode字符3:

def text_to_bits(text, encoding='utf-8', errors='surrogatepass'):
    bits = bin(int.from_bytes(text.encode(encoding, errors), 'big'))[2:]
    return bits.zfill(8 * ((len(bits) + 7) // 8))

def text_from_bits(bits, encoding='utf-8', errors='surrogatepass'):
    n = int(bits, 2)
    return n.to_bytes((n.bit_length() + 7) // 8, 'big').decode(encoding, errors) or '\0'

这是与Python 2/3兼容的单源版本:

import binascii

def text_to_bits(text, encoding='utf-8', errors='surrogatepass'):
    bits = bin(int(binascii.hexlify(text.encode(encoding, errors)), 16))[2:]
    return bits.zfill(8 * ((len(bits) + 7) // 8))

def text_from_bits(bits, encoding='utf-8', errors='surrogatepass'):
    n = int(bits, 2)
    return int2bytes(n).decode(encoding, errors)

def int2bytes(i):
    hex_string = '%x' % i
    n = len(hex_string)
    return binascii.unhexlify(hex_string.zfill(n + (n & 1)))

>>> text_to_bits('hello')
'0110100001100101011011000110110001101111'
>>> text_from_bits('110100001100101011011000110110001101111') == u'hello'
True

3
@JFSebastian我在python当前版本中尝试了此方法,看来它不起作用。<br/> TypeError:'str'不支持缓冲区接口<br/>您是否会更新答案
hamza 2012年

3
@hamza:它适用于Python2。在Python 3上,您应该首先将str转换为字节,例如,your_string.encode('ascii', 'strict')
jfs

1
@JFSebasitian:谢谢,但是,当我尝试反之时,unhexlify函数返回错误消息:binascii.Error:奇数长度的字符串。
hamza 2012年

3
@hamza:'0'如果十六进制字符串的长度不均匀,则在其前面加上。如果原始字符串中的第一个字符的ascii码小于16(例如'\n'或),则会发生这种情况'\t'。ASCII字母永远不会出现奇数长度[ -~]
jfs 2012年

22

内置python

这是用于简单字符串的纯python方法,此处保留以供后代使用。

def string2bits(s=''):
    return [bin(ord(x))[2:].zfill(8) for x in s]

def bits2string(b=None):
    return ''.join([chr(int(x, 2)) for x in b])

s = 'Hello, World!'
b = string2bits(s)
s2 = bits2string(b)

print 'String:'
print s

print '\nList of Bits:'
for x in b:
    print x

print '\nString:'
print s2

String:
Hello, World!

List of Bits:
01001000
01100101
01101100
01101100
01101111
00101100
00100000
01010111
01101111
01110010
01101100
01100100
00100001

String:
Hello, World!

2
chr(int())是我想要的!
JqueryToAddNumbers

正是我也在寻找!
Joachim

9

我不知道您认为除了逐个字符外,您还能怎么做-它本质上是逐个字符的操作。当然,这里有代码可以为您执行此操作,但是没有一种比逐个字符执行“简单”的方法了。

首先,您需要去除0b前缀,并将字符串左零填充,以便其长度能被8整除,以使将位字符串划分为字符变得容易:

bitstring = bitstring[2:]
bitstring = -len(bitstring) % 8 * '0' + bitstring

然后将字符串分成八个八位数字的块,将它们转换为ASCII字符,然后将它们重新组合为字符串:

string_blocks = (bitstring[i:i+8] for i in range(0, len(bitstring), 8))
string = ''.join(chr(int(char, 2)) for char in string_blocks)

如果您实际上想将其视为数字,则仍然需要考虑以下事实:如果要从左到右而不是从右到左,最左边的字符最多为七个数字。


2

这是我解决您任务的方法:

str = "0b110100001100101011011000110110001101111"
str = "0" + str[2:]
message = ""
while str != "":
    i = chr(int(str[:8], 2))
    message = message + i
    str = str[8:]
print message

为什么要在str =“ 0” + str [2:]处添加'0'?因为它是开始,所以需要在此处删除0b。
bimlesh sharma 2013年

2

如果您不想导入任何文件,则可以使用以下命令:

with open("Test1.txt", "r") as File1:
St = (' '.join(format(ord(x), 'b') for x in File1.read()))
StrList = St.split(" ")

将文本文件转换为二进制文件。

您可以使用它将其转换回字符串:

StrOrgList = StrOrgMsg.split(" ")


for StrValue in StrOrgList:
    if(StrValue != ""):
        StrMsg += chr(int(str(StrValue),2))
print(StrMsg)

希望对您有所帮助,我将其与一些自定义加密一起用于通过TCP发送。


1

您是否正在寻找执行此操作的代码或了解算法?

这会满足您的需求吗?特别是a2b_uub2a_uu?还有很多其他选择,以防您不想要这些。

(注意:不是Python专家,但这似乎是一个显而易见的答案)


我一直在研究它,binascii不适用于我,并且主要在寻找代码,如果我能看到的话,我就能理解它。谢谢你,尽管编辑:当使用binascii a2b_uu为“ h”将ascii转换为二进制时,\ x00 \ x00 \ x00 \ x00 \ x00 \ x00 \ x00 \ x00 \ x00这不是我所需要的,我需要'hello'以及实际的1和0不是shellcode看起来是ascii,它也只能按char进行工作
sbrichards 2011年

@Jaxidian对我的目的很有帮助。有人将一些数据存储在字符串中,我有它。我很确定这是填充的64binary b / c。我可以成功地使用b2a_base64它,但是结果的确充其量是令人困惑的。如何从那里获取布尔/整数(0,1)的列表?
Ufos

0

将二进制转换为其等效字符。

k=7
dec=0
new=[]
item=[x for x in input("Enter 8bit binary number with , seprator").split(",")]
for i in item:
    for j in i:
        if(j=="1"):
            dec=2**k+dec
            k=k-1
        else:
            k=k-1
    new.append(dec)
    dec=0
    k=7
print(new)
for i in new:
    print(chr(i),end="")

-1

这是JF Sebastian的精简版本。感谢JF Sebastian的摘录。

import binascii, sys
def goodbye():
    sys.exit("\n"+"*"*43+"\n\nGood Bye! Come use again!\n\n"+"*"*43+"")
while __name__=='__main__':
    print "[A]scii to Binary, [B]inary to Ascii, or [E]xit:"
    var1=raw_input('>>> ')
    if var1=='a':
        string=raw_input('String to convert:\n>>> ')
        convert=bin(int(binascii.hexlify(string), 16))
        i=2
        truebin=[]
        while i!=len(convert):
            truebin.append(convert[i])
            i=i+1
        convert=''.join(truebin)
        print '\n'+'*'*84+'\n\n'+convert+'\n\n'+'*'*84+'\n'
    if var1=='b':
        binary=raw_input('Binary to convert:\n>>> ')
        n = int(binary, 2)
        done=binascii.unhexlify('%x' % n)
        print '\n'+'*'*84+'\n\n'+done+'\n\n'+'*'*84+'\n'
    if var1=='e':
        aus=raw_input('Are you sure? (y/n)\n>>> ')
        if aus=='y':
            goodbye()
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.