Python文件操作

时间:2022-09-28 从未止步.. 人气:0

从文件中读取数据

1：读取整个文件

首先创建一个文件，它包含一些文本信息，注意：如果该文件为.py文件，则再进行操作的时候可以不写路径，如果不是.py文件，则必须标明路径。

现在我们创建一个python文件，名为text.py,给他写入如下文本信息：

下面的程序打开并读取这个文件，再将其内容显示到屏幕上：

with open('text.py') as pythonProject2:#open(要打开的文件名称)
#open函数返回一个表示文件test.py的对象，python将该对象赋给pythonProject2
    cc=pythonProject2.read()
print(cc)

python在当前执行的文件所在目录中查找指定的文件

关键字 with 在不再需要访问文件后将其关闭在这个程序中，注意到我们调用了 open()，但没有调用 close()。也可以调用 open()和 close()来打开和关闭文件，但这样做时，如果程序存在 bug 导致方法 close()未执行，文件将不会关闭。这看似微不足道，但未妥善关闭文件可能导致数据丢失或受损。如果在程序中过早调用 close()，你会发现需要使用文件时它已关闭（无法访问），这会导致更多的错误。并非在任何情况下都能轻松确定关闭文件的恰当时机，但通过使用前面所示的结构(with open(需要打开的文件名称) as 赋给另一个对象)，可让 Python 去确定：你只管打开文件，并在需要时使用它，Python 自会在合适的时候自动将其关闭。

细心的同学已经发现了，我们上文所输出的内容多了一行空格，原因是：read()到达文件末尾的时候返回一个空的字符串，而将这个空字符串显示出来就是一个空格，而想要删除空行只需要使用我们之前学习过的rstrip()函数。

为什么要提供文件路径

将类似于 .txt 的简单文件名传递给函数 open()时,Python 将在当前执行的文件(即物程序文件）所在的目录中查找。

根据你组织文件的方式，有时可能要打开不在程序文件所属目录中的文件。例如，你可能将程序文件存储在了文件夹 python_work中,而该文件夹中有一个名为 text_files 的文件夹用于存储程序文件操作的文本文件。虽然文件夹 text_files 包含在文件夹python_work 中，但仅向 open()传递位于前者中的文件名称也不可行，因为 Python 只在文件夹 python_work中查找，而不会在其子文件夹 text_files 中查找。要让 Python 打开不与程序文件位于同一个目录中的文件，需要提供文件路径，让Python 到系统的特定位置去查找。

否则会出现如下图所示：python会告诉你找不到该文件

那么该怎么解决这个问题呢？

这里我们就需要用绝对路径，例如，我们现在建立一个.txt在桌面。

下面我们使用相对路径（仅提供文件名的方式），去打开：

with open(r"新建文本文档.txt",'r',encoding='utf-8') as f:
    ff=f.read()
print(ff)

我们发现文件根本打不开。

现在我们使用绝对路径（提供具体的位置信息），去打开：

with open(r"C:\Users\Lenovo\Desktop\新建文本文档.txt",'r',encoding='utf-8') as f:
    ff=f.read()
print(ff)

文件内容被很好的显示出来了。

注：encoding='utf-8的作用是为了避免出现乱码。

上图所示程序，不加encoding='utf-8，就会出现以下情况；

注：显示文件路径时，Windows系统使用反斜杠（\）,而不是斜杠（/），但在代码中仍可以使用斜杠。

如果在文件路径中直接使用反斜杠，将引发错误，因为反斜杠用于对字符串中的字符进行转义。

举例：

C:\path\to\file.txt

其中的\t会被解读为制表符，如果一定要使用反斜杠，可对相对路径中的每个反斜杠都进行转义：

C:\\path\\to\\file.txt

逐行读取

读取文件时，常常需要检查其中的每一行：可能要在文件中查找特定的信息，或者要以某种方式修改文件中的文本。

直接使用for循环的方法：

在该目录下的文件读取：

for line in open("123.txt",encoding='utf-8'):
    print(line)

计算机其他位置中的：

for line in open(r"C:\Users\Lenovo\Desktop\新建文本文档.txt",encoding='utf-8'):
    print(line)

使用while循环

在该目录下的文件读取：

f=open("123.txt",encoding='utf-8')
line=f.readline()
while line:
    print(line)
    line=f.readline()
f.close()

计算机其他位置中的：

f=open(r"C:\Users\Lenovo\Desktop\新建文本文档.txt",encoding='utf-8')
line=f.readline()
while line:
    print(line)
    line=f.readline()
f.close()

使用with…as结构

在该目录下的文件读取：

with open("123.txt",encoding='utf-8') as f:
    for line  in f:
        print(line)

计算机其他位置中的：

with open(r"C:\Users\Lenovo\Desktop\新建文本文档.txt",encoding='utf-8') as f:
    for line in f:
        print(line)

运行上面两个文件的结果：

hi,python

早上好

晚上好

你好

窗前明月光，疑似地上霜

举头望明月，低头思归乡

鹅鹅鹅，曲项向天歌

白毛浮绿水，红掌拨清波

我们不难发现，空白行变得更多了，原因是：在这个文件中，每行末尾都有一个看不见的换行符，而print函数在调用的时候也会产生一个换行符，因此每行末尾都会有两个换行符，一个来自文件，一个来自print函数的调用，要想消除这些换行符，可在调用print函数的时候，使用rstrip():

print(line.rstrip())

处理之后的结果：

窗前明月光，疑似地上霜
举头望明月，低头思归乡
鹅鹅鹅，曲项向天歌
白毛浮绿水，红掌拨清波

hi,python
早上好
晚上好
你好

创建一个包含文件各行内容的列表

使用关键字 with 时，open()返回的文件对象只在 with 代码块内可用。如果要在 with 代码块外访问文件的内容，可在 with 代码块内将文件的各行存储在一个列表中，并在 with 代码块外使用该列表：可以立即处理文件的各个部分，也可以推迟到程序后面再处理。

with open("123.txt",encoding='utf-8') as f:
    lines=f.readlines()#使用readlines()从文件中读取每一行，并将其存储在一个列表中
    //这样处理后，在with代码块外仍然可以使用变量lines
for line  in lines:
    print(line)

输出结果：

hi,python

早上好

晚上好

你好

使用文件中的内容

举例：

with open("123.txt",encoding='utf-8') as f:
    lines=f.readlines()
pi=str()#创建空的字符串用于存储文本内容
for line  in lines:
    pi+=line.rstrip()#将每行末尾的空行去掉
print(pi)
print(len(pi))#输出字符串的长度

1234562345671038417968539
25

注：读取文本文件的时候，python会自动将所有的文本文件解读成字符串，如果文本文件中的内容为数值，并且要作为数值使用，就必须使用int()函数，或者float（）函数将其进行转化。

举例：

如果上述例子中的123.txt中的内容要作为数值使用，则程序应进行修改：

如下：

with open("123.txt",encoding='utf-8') as f:
    lines=f.readlines()
pi=int()#进行强制转化
#pi=float()
for line  in lines:
    pi+=int(line)
    #pi+=float(line)
print(pi)

1038418326562

包含千位以上的大型文件

前面我们所分析的都是包含几行的文本文件，现在假设我们有一个文件，其中包含精确到小数点后千位而不是30位的圆周率，也可创建一个字符串将他包含到里面，有的小伙伴想到这个问题会觉得很棘手，程序该怎么写呢？

其实，我们前面编撰好的程序就可以直接进行传递使用：

with open("123.txt",encoding='utf-8') as f:
    lines=f.readlines()
pi=str()#创建空的字符串用于存储文本内容
for line  in lines:
    pi+=line.rstrip()#将每行末尾的空行去掉
print(f"{pi[:52]}.....")#为了避免显示的内容不停的滚动，只打印前52位
print(len(pi))#输出字符串的长度

1234562345671038417968539168519635885951538287826636.....
1596

同理，对于万位，百万位等等更大的文件，我们的程序仍然可以使用。

圆周率中包含你的生日吗

with open("123.txt",encoding='utf-8') as f:
    lines=f.readlines()
pi=str()#创建空的字符串用于存储文本内容
for line  in lines:
    pi+=line.rstrip()#将每行末尾的空行去掉
you_birthday=str(input("请输入你的生日"))
if you_birthday in pi:
    print("yes")
else:
    print("NO")

请输入你的生日0904
yes

写入文件

1：写入空文件：

要将文本写入文件，你在调用open（）时，需要提供另一个参数，告诉python，你要写入打开的文件.

举例：

with open("123.txt",'w',encoding='utf-8') as f:
    f.write("晚上好")

打开该文件：

#open(名称，操作模式 )#操作模式包括：w:写，r:读取 ，a:附加，r+:读写`

如果省略了操作模式，python自动以只读的方式打开，如果要写入的文件不存在，python的open（）函数将自动创建它，以写入的模式（w）打开，如果该文件已存在，则python会自动清空之前的内容。

python只能将字符串写入文本文件文件，要是想将数据存储到文本文件中，需要先用str（）将其转化为字符串格式。

写入多行：

函数write（）不会在写入的文本末尾添加换行符，因此如果写入多行时没有指定换行符，文件看起来可能不是我们想要的那样：

举例：

with open("123.txt",'w',encoding='utf-8') as f:
    f.write("早上好---good morning")
    f.write("中午好---good afternoon")
    f.write("晚上好---good evening")

如下图所示，所有的内容都被显示在一行：

怎么解决这种问题呢？需要在方法调用write（）中包含换行符：

with open("123.txt",'w',encoding='utf-8') as f:
    f.write("早上好---good morning\n")
    f.write("中午好---good afternoon\n")
    f.write("晚上好---good evening\n")

现在文本内容呈现在不同行中：

像显示到终端一样，还可以使用空格，制表符和空行来设置这些输出的格式。

附加到文件

如果要给文件添加内容而不是覆盖原来的内容，可以以附加模式打开文件，以附加模式打开文件时，python不会在返回文件对象前清空文件的内容，而是将写入文件的行添加到文件末尾，如果指定的文件不存在，python会为你创建一个空文件。

举例：

with open("123.txt",'a',encoding='utf-8') as f:#以附加模式打开
    f.write("hello,world")#将hello，world写入文件

原内容并没有被清空。

加载全部内容