python3 pathlib替代os.path
yoyoketang 人气:0前言
如果你还在为操作文件路径烦恼,不会使用os.path模块,那么是时候试试pathlib了。
pathlib 库
pathlib 库从 python3.4 开始,到 python3.6 已经比较成熟。如果你的新项目可以直接用 3.6 以上,建议用 pathlib。相比于老式的 os.path 有几个优势:
- 老的路径操作函数管理比较混乱,有的是导入 os, 有的又是在 os.path 当中,而新的用法统一可以用 pathlib 管理。
- 老用法在处理不同操作系统 win,mac 以及 linux 之间很吃力。换了操作系统常常要改代码,还经常需要进行一些额外操作。
- 老用法主要是函数形式,返回的数据类型通常是字符串。但是路径和字符串并不等价,所以在使用 os 操作路径的时候常常还要引入其他类库协助操作。新用法是面向对象,处理起来更灵活方便。
- pathlib 简化了很多操作,用起来更轻松。
常用的 pathlib 和 os 对比图
操作 | os and os.path | pathlib |
---|---|---|
绝对路径 | os.path.abspath | Path.resolve |
修改权限 | os.chmod | Path.chmod |
创建目录 | os.mkdir | Path.mkdir |
重命名 | os.rename | Path.rename |
移动 | os.replace | Path.replace |
删除目录 | os.rmdir | Path.rmdir |
删除文件 | os.remove, os.unlink | Path.unlink |
工作目录 | os.getcwd | Path.cwd |
是否存在 | os.path.exists | Path.exists |
用户目录 | os.path.expanduser | Path.expanduser and Path.home |
是否为目录 | os.path.isdir | Path.is_dir |
是否为文件 | os.path.isfile | Path.is_file |
是否为连接 | os.path.islink | Path.is_symlink |
文件属性 | os.stat | Path.stat, Path.owner, Path.group |
是否为绝对路径 | os.path.isabs | PurePath.is_absolute |
路径拼接 | os.path.join | PurePath.joinpath |
文件名 | os.path.basename | PurePath.name |
上级目录 | os.path.dirname | PurePath.parent |
同名文件 | os.path.samefile | Path.samefile |
后缀 | os.path.splitext | PurePath.suffix |
pathlib 获取文件路径
Path.cwd 获取当前文件夹路径
需注意的是,返回的不是字符串,而是 WindowsPath 对象
from pathlib import Path # 1.可以直接调用类方法.cwd() print(Path.cwd()) # C:\Users\dell\PycharmProjects\untitled3\demo # 2.也可以实例化后调用 p = Path('./') print(p.cwd()) # C:\Users\dell\PycharmProjects\untitled3\demo print(type(p.cwd())) # <class 'pathlib.WindowsPath'>
获取当前文件路径
from pathlib import Path # 当前文件路径 p = Path(__file__) print(p)
获取 Path 对象绝对路径
from pathlib import Path # 当前文件路径 p = Path('data.json') print(p) # data.json 对象 print(p.absolute()) # C:\Users\dell\PycharmProjects\untitled3\demo\data.json
一些常用的获取文件属性
from pathlib import Path # 当前文件路径 p = Path(__file__) print(p.absolute()) # 获取绝对路径 print(p.resolve()) # 获取绝对路径 print(p.name) # 获取文件名称 'a1117.py' print(p.stem) # 只要文件名,不要后缀 a1117 print(p.suffix) # 获取文件 后缀.py print(p.suffixes) # 文件所有的猴子 ['.py'] print(p.parts) # 拆分('C:\\', 'Users', 'dell', 'PycharmProjects', 'untitled3', 'demo', 'a1117.py') print(p.parent) # C:\Users\dell\PycharmProjects\untitled3\demo print(p.parent.parent) # C:\Users\dell\PycharmProjects\untitled3 print(p.parents) # 所有的父级 <WindowsPath.parents> print(p.anchor) # 锚,目录前面的部分 C:\ 或者 /
获取上层,上上层目录
from pathlib import Path # .parent 获取上一层 print(Path.cwd().parent) # 实例化后调用 .parent p = Path('./') print(p.cwd().parent)
获取上上层使用链式方法调用 .parent.parent
from pathlib import Path # .parent 获取上一层 print(Path.cwd().parent.parent) # 实例化后调用 .parent p = Path('./') print(p.cwd().parent.parent)
获取用户home目录
from pathlib import Path print(Path.home()) # c:\Users\dell
判断文件,文件夹
is_file()判断是不是文件
from pathlib import Path # 1. is_file() 判断是不是文件 print(Path.cwd().is_file()) # False # 2.也可以实例化后调用 p = Path('./data.json') print(p.is_file()) # True
is_dir() 判断是否是文件夹
from pathlib import Path # 1. is_file() 判断是不是文件 print(Path.cwd().is_dir()) # True # 2.也可以实例化后调用 p = Path('./data.json') print(p.is_dir()) # False
exists() 判断文件 或文件夹是否存在
from pathlib import Path # exists() 判断是否存在 p = Path('./data.json') print(p.exists()) # True or False
is_absolute() 判断是否是绝对路径
from pathlib import Path # 当前文件路径 p = Path(__file__) print(p) print(p.is_absolute()) # True
joinpath 拼接目录
可以用类似 os.path.join 的方法
from pathlib import Path # 当前文件路径 p = Path('./') print(p.absolute()) # C:\Users\dell\PycharmProjects\untitled3\demo print(p.joinpath('data.json')) # data.json print(p.joinpath('data.json').absolute()) # C:\Users\dell\PycharmProjects\untitled3\demo\data.json # 拼接多层 print(p.joinpath('files', 'data.json')) # files\data.json print(p.joinpath('files', 'data.json').absolute()) # C:\Users\dell\PycharmProjects\untitled3\demo\files\data.json
pathlib 支持用 / 拼接路径, 这种语法估计用的人很少
from pathlib import Path # 当前文件路径 p = Path('./') # / 拼接 new_path = p / 'files' / 'data.json' print(new_path.absolute())
iterdir()遍历文件目录
比如在当前脚本的 files 目录有以下文件夹和子文件
.iterdir() 遍历某个目录下的所有路径(文件和子目录)
from pathlib import Path # 当前文件路径 p = Path('files') for i in p.iterdir(): print(i.absolute()) """运行结果: C:\Users\dell\PycharmProjects\untitled3\demo\files\json C:\Users\dell\PycharmProjects\untitled3\demo\files\username.txt C:\Users\dell\PycharmProjects\untitled3\demo\files\yaml """
如果只需获取文件夹,可以加个判断.is_dir()
from pathlib import Path # 当前文件路径 p = Path('files') print([i for i in p.iterdir() if i.is_dir()]) # [WindowsPath('files/json'), WindowsPath('files/yaml')]
也可以用.is_file获取文件对象
from pathlib import Path # 当前文件路径 p = Path('files') print([i for i in p.iterdir() if i.is_file()]) # [WindowsPath('files/username.txt')]
glob() 和 rglob() 模式匹配(正则表达式)
使用模式匹配(正则表达式)匹配指定的路径。glob 只会匹配当前目录下, rglob 会递归所有子目录 比如在当前脚本的 files 目录有以下文件夹和子文件
glob 只会匹配当前目录下
from pathlib import Path p = Path('files') # glob 只会遍历查找当前目录 print(p.glob('*.txt')) # <generator object Path.glob at 0x000001A44565A518> print([i for i in p.glob('*.txt')]) # [WindowsPath('files/username.txt')] print([i for i in p.glob('*.yml')]) # []
rglob 会递归所有子目录
from pathlib import Path p = Path('files') # glob 只会遍历查找当前目录 print(p.rglob('*.txt')) # <generator object Path.glob at 0x000001A44565A518> print([i for i in p.rglob('*.txt')]) # [WindowsPath('files/username.txt')] print([i for i in p.rglob('*.yml')]) # [WindowsPath('files/yaml/aa.yml'), WindowsPath('files/yaml/bb.yml')]
match() 检查路径是否符合规则
from pathlib import Path p = Path('data.json') # math 检查匹配规则 print(p.match('*.json')) # True
创建文件操作
touch() 创建文件
from pathlib import Path p = Path('xx.json') p.touch() # 创建一个xx.json
当文件已经存在的时候,p.touch() 也不会报错,因为默认参数 exist_ok=True 如果设置 exist_ok=False, 文件已经存在,touch就会报错了
from pathlib import Path p = Path('xx.json') p.touch(exist_ok=False) # 创建一个xx.json
抛出异常FileExistsError: [Errno 17] File exists: 'xx.json'
mkdir() 创建目录
在当前脚本下创建一个yoyo目录
from pathlib import Path p = Path('yoyo') # mkdir 创建yoyo目录 p.mkdir()
如果想一次性创建多层目录 'yoyo/json'
from pathlib import Path p = Path('yoyo/json') # mkdir 创建yoyo/json目录 p.mkdir()
此时会抛出异常FileNotFoundError: [WinError 3] 系统找不到指定的路径。: 'yoyo\json'
递归创建目录mkdir(parents=True)
from pathlib import Path p = Path('yoyo/json') # mkdir 创建yoyo/json目录 p.mkdir(parents=True)
删除文件操作
删除目录非常危险,并且没有提示,一定要谨慎操作
rmdir() 一次只删除一级目录,且当前目录必须为空。
from pathlib import Path p = Path('yoyo/json') # mkdir 创建yoyo/json目录 p.rmdir()
unlink() 删除文件
from pathlib import Path p = Path('files/username.txt') p.unlink()
文件读写操作
pathlib 对读取和写入进行了简单的封装,不再需要重复去打开文件和管理文件的关闭了。
- .read_text() 读取文本
- .read_bytes() 读取 bytes
- .write_text() 写入文本
- .write_bytes() 写入 tytes
from pathlib import Path p = Path('yo.txt') p.write_text("hello world") print(p.read_text()) # hello world
file.write 操作使用的是 w 模式,如果之前已经有文件内容,将会被覆盖。
修改文件
replace() 移动文件
from pathlib import Path p = Path('yo.txt') p.write_text("hello world") print(p.read_text()) # hello world p.replace('xx.json')
with_name() 重命名文件
from pathlib import Path p = Path('hello.txt') p.write_text("hello world") print(p.read_text()) # hello world # 重命名为一个新的文件对象 new_file = p.with_name('x.txt') print(new_file) p.replace(new_file) # 移动到新的位置
总结
加载全部内容