Python解析JSON对象 Python解析JSON对象的全过程记录
北山啦 人气:0前言
本章节我们将为大家介绍如何使用 Python 语言来编码和解码 JSON 对象。
json处理模块的主要任务,是将一个JSON对象,转换成Python数据类型数据进行处理,或者反之,将Python数据类型数据,转换成JSON对象(字符串流),在不同的模块或者系统间传输。
1. JSON数据格式特点
- 对象表示为键值对
- 数据由逗号分隔
- 花括号保存对象
- 方括号保存数组
{ "students": [ { "name":"北山啦" , "age":20 }, { "name":"张三" , "age":30 }, { "name":"里斯" , "age":17 } ] }
{'students': [{'name': '北山啦', 'age': 20}, {'name': '张三', 'age': 30}, {'name': '里斯', 'age': 17}]}
上面就是一个JSON格式数据。它开起来就像是在Python中的字典数据类型。我们可以通过json模块将它转换成字符串或者反过来将字符串转换成字典数据类型。
JSON也支持各种数据类型,它的数据类型和Python各种数据类型之间的对比如下:
- object —— dict
- array —— list
- string —— str
- number —— int/float
- true/false —— True/False
- null —— None
2. 常用方法总结
在json模块中,用于处理json的主要是四个函数,分别是:
- loads():从JSON字符串中读取数据并转换成Python数据类型
- load():从JSON文件中读取数据并转换成Python数据类型
- dumps():将Python数据类型数据转换成JSON字符串
- dump():将Python数据类型数据转换成JSON字符串写入到文件
3. 系列化和反系列化
从JSON数据转换到Python数据,叫反系列化(deserialization)
从Python数据转换到JSON数据,叫系列化(serialization)
3.1 系列化
系列化:将Python数据转换成JSON字符串的方法。
下面我们先来看一个简单的例子。
import json data = { "students": [ { "name":"北山啦" , "age":20 }, { "name":"张三" , "age":30 }, { "name":"里斯" , "age":17 } ] } print(type(data)) print(data) json_str = json.dumps(data) print(type(json_str))
<class 'dict'> {'students': [{'name': '北山啦', 'age': 20}, {'name': '张三', 'age': 30}, {'name': '里斯', 'age': 17}]} <class 'str'>
上面的例子中,虽然看起来数据没有发生变化,但其实它们的数据类型已经发生了本质的改变:将字典数据类型的data,转换成了str类型,然后我们就可以将这个str类型的数据转换成流,在网络上进行传输或者写入到文件等。
import json data = { "students": [ { "name":"北山啦" , "age":20 }, { "name":"张三" , "age":30 }, { "name":"里斯" , "age":17 } ] } print(type(data)) print(data) json_str = json.dumps(data, separators=('>>','::'), indent=2) print(json_str)
<class 'dict'> {'students': [{'name': '北山啦', 'age': 20}, {'name': '张三', 'age': 30}, {'name': '里斯', 'age': 17}]} { "students"::[ { "name"::"\u5317\u5c71\u5566">> "age"::20 }>> { "name"::"\u5f20\u4e09">> "age"::30 }>> { "name"::"\u91cc\u65af">> "age"::17 } ] }
将data写入txt文件中
import json data = { "students": [ { "name":"北山啦" , "age":20 }, { "name":"张三" , "age":30 }, { "name":"里斯" , "age":17 } ] } with open("students.txt","w") as fp: json.dump(data, fp, ensure_ascii=False) print("finish")
finish
这样就将data写入了students.txt,看看是不是已经将数据写进去了。
3.2 反系列化
从JSON数据转换到Python类型数据,叫反系列化。可以通过loads()/load()这两个方法来完成。
import json with open("students.txt") as fp: data = json.load(fp) """取出字典key为students的数据, 得到一个list,再从这个list中取第一个数据""" print(data['students'][0])
{'name': '北山啦', 'age': 20}
parse_int参数
默认值为None,如果指定了parse_int,用来对JSON int字符串进行解码,这可以用于为JSON整数使用另一种数据类型或解析器。
parse_int参数,这里我们简单将其指定为float类型。
import json with open("students.txt") as fp: data = json.load(fp, parse_int = float) print(data)
{'students': [{'name': '北山啦', 'age': 20.0}, {'name': '张三', 'age': 30.0}, {'name': '里斯', 'age': 17.0}]}
可以看到,age原来是整数类型,通过parse_int已经被转换成了float类型。
object_hook
默认值为None,object_hook是一个可选函数,此功能可用于实现自定义解码器。指定一个函数,该函数负责把反序列化后的基本类型对象转换成自定义类型的对象。
def fromJSON(dct): # 这里会对所有的字典数据类型都进行遍历 if isinstance(dct, dict) and 'students' in dct: return dct['students'] else: return Student(dct['name'], dct['age']) import json with open("students.txt") as fp: data = json.load(fp, object_hook=fromJSON) print(data)
[姓名: 北山啦, 年龄: 20, 姓名: 张三, 年龄: 30, 姓名: 里斯, 年龄: 17]
总结
加载全部内容