python 二进制转换
微小冷 人气:0在pyton中,通过struct模块来对二进制进行转换,主要包括两大类函数,即用于打包的pack和用于解包的unpack。
其中,struct.pack的输入格式为struct.pack(format, v1, v2, ...),其中format为格式字符串,v1,v2..为将要转成bytes的字符。
例如
>>> import struct >>> struct.pack('i', 15) b'\x0f\x00\x00\x00' >>> struct.pack('iii', 15, 16, 17) b'\x0f\x00\x00\x00\x10\x00\x00\x00\x11\x00\x00\x00' >>> struct.pack('b', 255) #b格式的取值范围是-128到127 struct.error: byte format requires -128 <= number <= 127 >>> struct.pack('B', 200) b'\xc8' >>> struct.pack('B', 71) #128以内可用ASCII表示 b'G'
i代表int,15对应的二进制代码为F000,故其输出为b\x0f\x00\x00\x00。当格式字符串为iii时,说明要将三个数字以整数类型转化为二进制。
其中,格式化字符串中的每个字符都代表一种数据类型,其中整型相关的字符如下,左侧为带符号整型,右侧为无符号整型
C语言类型 | C语言类型 | 标准大小 | ||
---|---|---|---|---|
b | signed char | B | unsigned char | 1 |
h | short | H | unsigned short | 2 |
i | int | I | unsigned int | 4 |
l | long | L | unsigned long | 4 |
q | long long | Q | unsigned long long | 8 |
n | ssize_t | N | size_t |
其他类型
格式 | C 类型 | Python 类型 | 标准大小 |
---|---|---|---|
x | 填充字节 | 无 | |
c | char | 长度为1的字节串 | |
? | _Bool | bool | 1 |
e | float | 2 | |
f | float | float | 4 |
d | double | float | 8 |
s | char[] | 字节串 | |
p | char[] | 字节串 | |
P | void* | 整数 |
struct中提供了获取标准大小的函数,calcsize:
>>> struct.calcsize('B') 1 >>> struct.calcsize('i') 4
除了声明被格式化时的数据类型,struct还可以指定对齐方式,例如
>>> struct.pack("i",15) b'\x0f\x00\x00\x00' >>> struct.pack(">i",15) #小端序 b'\x00\x00\x00\x0f' >>> struct.pack("<i",15) #大端序 b'\x0f\x00\x00\x00'
其对应字符的含义分别为
@ | = | < | > | ! |
---|---|---|---|---|
本机 | 本机 | 小端 | 大端 | 网络(大端) |
其中默认为@,即本机字节顺序。
在熟悉了pack之后,与之对偶的unpack也就没啥难度了
>>> test = struct.pack("III",125,1255,12555) >>> struct.unpack("III",test) (125, 1255, 12555)
除了pack和unpack,struct模块还提供了C语言风格的一对函数pack_into和unpack_from,二者的声明分别为
struct.pack_into(format, buffer, offset, v1, v2, ...) struct.unpack_from(format, /, buffer, offset=0)
其中buffer表示缓冲流,在pack_into中,将v1,v2...以offset的偏置打包入buffer中;在unpack_from中,将buffer中的数据从offset处依次取出。
struct中封装了用于二进制处理的类Struct,按照以往经验,其pack函数的实现方法很有可能是下面这种
def pack(format,*args): return Struct(format).pack(args)
其中Struct的初始化方法就是输入一个格式化字符串,例如
>>> s = struct.Struct("III") >>> s.pack(1,2,3) b'\x01\x00\x00\x00\x02\x00\x00\x00\x03\x00\x00\x00'
加载全部内容