python 二进制转换

时间:2022-05-23 微小冷人气:0

在pyton中，通过struct模块来对二进制进行转换，主要包括两大类函数，即用于打包的pack和用于解包的unpack。

其中，struct.pack的输入格式为struct.pack(format, v1, v2, ...)，其中format为格式字符串，v1,v2..为将要转成bytes的字符。

例如

>>> import struct
>>> struct.pack('i', 15)
b'\x0f\x00\x00\x00'
>>> struct.pack('iii', 15, 16, 17)
b'\x0f\x00\x00\x00\x10\x00\x00\x00\x11\x00\x00\x00'
>>> struct.pack('b', 255)   #b格式的取值范围是-128到127
struct.error: byte format requires -128 <= number <= 127
>>> struct.pack('B', 200)
b'\xc8'
>>> struct.pack('B', 71)    #128以内可用ASCII表示
b'G'

i代表int，15对应的二进制代码为F000，故其输出为b\x0f\x00\x00\x00。当格式字符串为iii时，说明要将三个数字以整数类型转化为二进制。

其中，格式化字符串中的每个字符都代表一种数据类型，其中整型相关的字符如下，左侧为带符号整型，右侧为无符号整型

	C语言类型		C语言类型	标准大小
b	signed char	B	unsigned char	1
h	short	H	unsigned short	2
i	int	I	unsigned int	4
l	long	L	unsigned long	4
q	long long	Q	unsigned long long	8
n	ssize_t	N	size_t

其他类型

格式	C 类型	Python 类型	标准大小
x	填充字节	无
c	char	长度为1的字节串
?	_Bool	bool	1
e		float	2
f	float	float	4
d	double	float	8
s	char[]	字节串
p	char[]	字节串
P	void*	整数

struct中提供了获取标准大小的函数，calcsize:

>>> struct.calcsize('B')
1
>>> struct.calcsize('i')
4

除了声明被格式化时的数据类型，struct还可以指定对齐方式，例如

>>> struct.pack("i",15)
b'\x0f\x00\x00\x00'
>>> struct.pack(">i",15)    #小端序
b'\x00\x00\x00\x0f'
>>> struct.pack("<i",15)    #大端序
b'\x0f\x00\x00\x00'

其对应字符的含义分别为

@	=	<	>	!
本机	本机	小端	大端	网络(大端)

其中默认为@，即本机字节顺序。

在熟悉了pack之后，与之对偶的unpack也就没啥难度了

>>> test = struct.pack("III",125,1255,12555)
>>> struct.unpack("III",test)
(125, 1255, 12555)

除了pack和unpack，struct模块还提供了C语言风格的一对函数pack_into和unpack_from，二者的声明分别为

struct.pack_into(format, buffer, offset, v1, v2, ...)
struct.unpack_from(format, /, buffer, offset=0)

其中buffer表示缓冲流，在pack_into中，将v1,v2...以offset的偏置打包入buffer中；在unpack_from中，将buffer中的数据从offset处依次取出。

struct中封装了用于二进制处理的类Struct，按照以往经验，其pack函数的实现方法很有可能是下面这种

def pack(format,*args):
    return Struct(format).pack(args)

其中Struct的初始化方法就是输入一个格式化字符串，例如

>>> s = struct.Struct("III")
>>> s.pack(1,2,3)
b'\x01\x00\x00\x00\x02\x00\x00\x00\x03\x00\x00\x00'

加载全部内容