Python多进程的使用
码农飞哥 人气:0一、进程的创建
Python
的multiprocessing
模块提供了Process
类,该类可用来在各平台下创建新进程。其构造函数是:
__init__(self, group=None, target=None, name=None, args=(), kwargs={})
其中,各个参数的含义如下:
group:
该参数未实现,不需要传参target
:为新建进程指定执行任务,也就是指定一个函数args
:以元组的方式,为target指定的方法传递参数,如果传入的是元组中有多个参数的话则传入方式是(arg1,arg2,....argn,)kwargs
:以字典的方法,为target指定的方法传递参数。name
: 为新建进程设置名称
1、一些常用方法介绍
start()
方法用于启动进程
run()
方法用于运行所要执行的任务
is_alive()
方法用于判断当前进程是否还活着
getPid()
方法用于获取进程的ID号。
直接创建Process类的实例对象,由此就可以创建一个新的进程;
这个就类似于直接创建实例化线程Thread类
from multiprocessing import Process import os # 定义要调用的方法 def async_fun(name, add): for arc in add: print(name + str(os.getpid()) + " " + arc) if __name__ == '__main__': my_tuple = ("码农飞哥", "今天是宅家的一天", "30岁了还没对象焦虑呀") # 创建进程 process = Process(target=async_fun, args=("子进程", my_tuple)) # 启动子进程 process.start() # 启动主进程 async_fun("主进程", my_tuple)
运行结果是:
主进程11610 码农飞哥
主进程11610 今天是宅家的一天
主进程11610 30岁了还没对象焦虑呀
子进程11612 码农飞哥
子进程11612 今天是宅家的一天
子进程11612 30岁了还没对象焦虑呀
这里需要注意的一点是,必须要将代码放在if __name__ == '__main__':
代码块中。通过os.getpid()
方法来获取进程号。
通过继承Process类的子类,创建实例对象,也可以创建新的进程。
第二种方式就是通过继承Process
类的子类,创建实例对象,也可以创建新的进程,不过这种方式需要重写父类的run()方法。这种方法就类似于直接继承Thread
类创建线程。
import multiprocessing import os # 定义要调用的方法 def async_fun(name, add): for arc in add: print(name + str(os.getpid()) + " " + arc) class MyProcess(multiprocessing.Process): def __init__(self, name, add): multiprocessing.Process.__init__(self) self.add = add self.name = name # 重写run()方法 def run(self): async_fun(self.name, self.add) if __name__ == '__main__': my_tuple = ("码农飞哥", "今天是宅家的一天", "宅家也不能虚度") myprocess = MyProcess("子进程", my_tuple) myprocess.start() # 主进程 async_fun("主进程", my_tuple)
运行结果同上:
主进程11610 码农飞哥
主进程11610 今天是宅家的一天
主进程11610 30岁了还没对象焦虑呀
子进程11612 码农飞哥
子进程11612 今天是宅家的一天
子进程11612 30岁了还没对象焦虑呀
这里还是推荐使用第一种方法创建进程,因为这种方式创建进程比较简洁
二、进程池的使用
由于创建进程对系统的开销比较大。所以,所以在实际开发中一般都会使用进程池来创建进程。进程池的使用与线程池的使用也是有神似的地方。同样的在multiprocessing
模块中提供了Pool
函数来创建进程池。
import os from multiprocessing import Pool import time # 定义要调用的方法 def async_fun(add): time.sleep(1) print("进程号:" + str(os.getpid()) + " " + add) if __name__ == '__main__': add = "码农飞哥,今天是宅家的一天,30岁了还没对象焦虑呀" # 创建包含4个进程的进程池 pool = Pool(processes=4) # 提交action pool.apply_async(func=async_fun, args=(add,)) pool.apply_async(func=async_fun, args=("加油加油",)) pool.close() pool.join()
运行结果是:
进程号:11658 码农飞哥,今天是宅家的一天,30岁了还没对象焦虑呀
进程号:11659 加油加油
同样的进程池也可以通过with语句来创建
from multiprocessing import Pool import os import time def async_add(max): time.sleep(1) print("进程号:" + str(os.getpid()) + "最大值是" + str(max)) if __name__ == '__main__': with Pool(processes=4) as pool: # 使用线程池执行max计算 results = pool.map(async_add, (20, 30, 40, 50))
运行结果是:
进程号:11726最大值是20
进程号:11725最大值是30
进程号:11727最大值是40
进程号:11728最大值是50
三、多进程和多线程的优缺点对比
多进程的优点就是稳定性好,一个子进程崩溃了,不会影响主进程以及其余子进程,各个子进程各用一套独立的内存空间。多线程的优点就是效率高,适用于批处理等功能。
多进程的缺点就是创建进程的代价非常大,因为操作系统要给每个进程分配固定的资源,并且操作系统对进程的总数会有一定的限制,若进程过多,操作系统调度都会存在问题,会造成假死状况。
总结:
加载全部内容