Python执行时间
用余生去守护 人气:0一、时间不一致的猜想
python脚本运行时间远远大于python脚本中统计的计算时间
猜想:
1.python中用到的是py2neo的写数据异步,阻塞进程运行;
2.python脚本使用统计时间的方式是time.clock(),而这种方式统计的是CPU的执行时间,不是程序的执行时间。
程序执行时间 = CPU运行时间 + IO时间 + 休眠或等待时间
二、原因探索
1.方法一
import asyncio import datetime starttime = datetime.datetime.now() # long running # do something other async def sayhi(): print("你好,若竹") await asyncio.sleep(10) print("用余生去守护") asyncio.run(sayhi()) endtime = datetime.datetime.now() print(("程序运行时间为:")+ str((endtime-starttime).seconds)+"秒")
输出:
你好,若竹
用余生去守护
程序运行时间为:10秒
datetime.datetime.now()获取的是当前日期,在程序执行结束之后,这个方式获得的时间值为程序执行的时间。
2.方法二
import asyncio import datetime import time starttime = time.time() # long running # do something other async def sayhi(): print("你好,若竹") await asyncio.sleep(10) print("用余生去守护") asyncio.run(sayhi()) endtime = time.time() print("程序运行时间为:"+ str(float(endtime-starttime))+"秒")
输出:
你好,若竹
用余生去守护
程序运行时间为:10.002257108688354秒
time.time()获取自纪元以来的当前时间(以秒为单位)。如果系统时钟提供它们,则可能存在秒的分数,所以这个地方返回的是一个浮点型类型。这里获取的也是程序的执行时间。
3.方法三
import asyncio import datetime import time starttime = time.clock() # long running # do something other async def sayhi(): print("你好,若竹") await asyncio.sleep(10) print("用余生去守护") asyncio.run(sayhi()) endtime = time.clock() print("程序运行时间为:"+ str(float(endtime-starttime))+"秒")
输出:
.\py_study.py:807: DeprecationWarning: time.clock has been deprecated in Python 3.3 and will be removed from Python 3.8: use time.perf_counter or time.process_time instead
starttime = time.clock()
你好,若竹
用余生去守护
.\py_study.py:818: DeprecationWarning: time.clock has been deprecated in Python 3.3 and will be removed from Python 3.8: use time.perf_counter or time.process_time instead
endtime = time.clock()
程序运行时间为:10.0219916秒
Deprecation Warning: time. clock has been deprecated in Python 3.3 and will be removed from Python 3.8: use time. perf_counter or time. process_time instead
弃用警告:时间。clock在Python 3.3中已弃用,并将从Python 3.8中移除:使用time。perf_counter或时间。process_time代替。
代码如下:
import asyncio import datetime import time starttime = time.perf_counter() # long running # do something other async def sayhi(): print("你好,若竹") await asyncio.sleep(10) print("用余生去守护") asyncio.run(sayhi()) endtime = time.perf_counter() print("程序运行时间为:"+ str(float(endtime-starttime))+"秒")
输出:
你好,若竹
用余生去守护
程序运行时间为:10.060287599999999秒
三、python 运行效率慢的原因
1.简介
编程语言的效率一方面指开发效率,即程序员完成编码所需的时间,另一方面是运行效率,即计算任务所需的时间。编码效率和运行效率往往很难兼顾。
2.运行效率慢的原因
1.python 是动态语言,造成运行时的不确定性影响运行效率;
动态语言是一类在运行时可以改变其结构的语言,如新的函数、对象、代码可以被引入,已有的函数可以被删除或其他结构上的变化等,该类语言更具有活性,但是不可避免的因为运行时的不确定性也影响运行效率。数据的比较和转换类型的开销很大,每次读取、写入或引用一个变量,都要检查类型。很难优化一种极具动态性的语言。Python的许多替代语言之所以快得多,原因在于它们为了性能在灵活性方面作出了牺牲。
2.python 是解释执行,不支持JIT(just in time compiler);
相比于C语言编译性语言编写的程序,Python是解释执行语言,其运行过程是Python运行文件程序时,Python解释器将源代码转换为字节码,然后再由Python解释器来执行这些字节码。其每次运行都要进行转换成字节码,然后再由虚拟机把字节码转换成机器语言,最后才能在硬件上运行,与编译性语言相比,其过程更复杂,性能肯定会受影响。
3.python 中一切皆对象,每个对象都需要维护引用计数,增加额外工作;
Python是一门面向对象的编程语言,其设计理念是一切皆是对象,如数字、字符串、元组、列表、字典、函数、方法、类、模块等都是对象,包括代码,每个对象都需要维护引用计数,因此,增加了额外工作,影响了性能。
4.python GIL,全局解释器锁导致无法实现真正的并发;
GIL是Python最为诟病的一点,因为GIL,Python中的多线程并不能真正的并发,即使在单线程,GIL也会带来很大的性能影响,因为python每执行100个opcode就会尝试线程的切换,因此,影响Python运行效率。
5.垃圾回收机制,会中断正在执行的程序,造成所谓的卡顿;
Python采用标记和分代的垃圾回收策略,每次垃圾回收的时候都会中断正在执行的程序,造成所谓的顿卡,影响运行效率。
四、python 优化
1.优化算法:时间复杂度
算法的时间复杂度对程序的执行效率影响最大,在python 中可以通过选择合适的数据结构来优化时间复杂度,如list和set查找某一个元素的时间复杂度分别是O(n)和O(1).不同的场景有不同的优化方式,总的来说,一般有分治,分支界限,贪心,动态规划等。
20减少冗余数据
如用上三角或下三角的方式去保存一个大的对称矩阵。在0元素占大多数的矩阵里使用稀疏矩阵表示。
3.合理使用copy与deepcopy
对于dict和list等数据结构的对象,直接赋值使用的是引用的方式。而有些情况下需要复制整个对象,这时可以使用copy包里的copy和deepcopy,这两个函数的不同之处在于后者是递归复制的。效率也不一样:(以下程序在ipython中运行)
4.使用dict或set查找元素
5.合理使用生成器(generator)和yield
6.优化循环
7.优化包含多个判断表达式的顺序
8.使用join合并迭代器中的字符串
9.选择合适的格式化字符方式
10.不借助中间变量交换两个变量的值
11.使用if is
12.使用级联比较x < y < z
13.while 1 比 while True 更快
14.使用**而不是pow
15.使用 cProfile, cStringIO 和 cPickle等用c实现相同功能(分别对应profile, StringIO, pickle)的包
16.使用最佳的反序列化方式
17.使用C扩展(Extension)
18.并行编程
19.终级大杀器:PyPy
20.使用性能分析工具
加载全部内容