Python实用技巧之临时文件的妙用
费弗里 人气:0当我们用Python
编写程序时,有时候需要临时存储数据且不希望占用多少内存,亦或是需要写出文件到文件系统供后续程序读取,这些情况下以创建临时文件的方式进行处理,既不会干扰本地文件系统,又安全省事。
而通过使用Python
中的标准库tempfile
,我们就可以很方便的进行临时文件相关操作,其主要用法有两种:
创建临时文件
tempfile
的经典用法之一是使用其TemporaryFile()
配合with
上下文管理器,在本地文件系统的临时文件目录下创建具有随机名称的文件,并且在with
内的代码执行完成后,该临时文件会自动被销毁:
import os import tempfile with tempfile.TemporaryFile() as f: print(f.name) print(os.path.exists(f.name)) print(os.path.exists(f.name))
基于这个特性,我们可以应用到很多场景下,譬如当我们希望将表格格式的字符串转换为pandas
数据框时,就可以像下面这样做:
raw_string='''a,b,c 1,1,1 2,2,2 3,3,3 4,4,4 ''' with tempfile.TemporaryFile('w+') as f: f.write(raw_string) f.seek(0) #将指针移回文件开头 demo_df=pd.read_CSV(f) demo_df
创建临时目录
前面展示了tempfile
创建临时文件的功能,而有些场景下,我们需要创建临时文件夹,这可以基于TemporaryDirectory()
来实现,特性类似TemporaryFile()
:
with tempfile.TemporaryDirectory() as p: print(p) print(os.path.exists(p)) print(os.path.exists(p))
典型的应用场景是配合TemporaryDirectory()
和shutil
生成压缩包文件:
import shutil import zipfile import numpy as np with tempfile.TemporaryDirectory() as p: # 模拟向当前临时目录下写出多个文件 for i in range(100): ( pd .DataFrame(np.random.rand(10, 3), columns=list('ABC')) .to_csv(os.path.join(p, f'demo{i+1}.csv'), index=False) ) # 将当前临时目录转为zip压缩包 shutil.make_archive('./demo', 'zip', p) # 查看目标压缩文件内的文件 [file.filename for file in zipfile.ZipFile('demo.zip').filelist]
加载全部内容