亲宝软件园·资讯

展开

Python文件操作

从未止步.. 人气:0

从文件中读取数据

1:读取整个文件

首先创建一个文件,它包含一些文本信息,注意:如果该文件为.py文件,则再进行操作的时候可以不写路径,如果不是.py文件,则必须标明路径。

现在我们创建一个python文件,名为text.py,给他写入如下文本信息:

下面的程序打开并读取这个文件,再将其内容显示到屏幕上:

with open('text.py') as pythonProject2:#open(要打开的文件名称)
#open函数返回一个表示文件test.py的对象,python将该对象赋给pythonProject2
    cc=pythonProject2.read()
print(cc)

python在当前执行的文件所在目录中查找指定的文件

关键字 with 在不再需要访问文件后将其关闭在这个程序中,注意到我们调用了 open(),但没有调用 close()。也可以调用 open()和 close()来打开和关闭文件,但这样做时,如果程序存在 bug 导致方法 close()未执行,文件将不会关闭。这看似微不足道,但未妥善关闭文件可能导致数据丢失或受损。如果在程序中过早调用 close(),你会发现需要使用文件时它已关闭(无法访问),这会导致更多的错误。并非在任何情况下都能轻松确定关闭文件的恰当时机,但通过使用前面所示的结构(with open(需要打开的文件名称) as 赋给另一个对象),可让 Python 去确定:你只管打开文件,并在需要时使用它,Python 自会在合适的时候自动将其关闭。

细心的同学已经发现了,我们上文所输出的内容多了一行空格,原因是:read()到达文件末尾的时候返回一个空的字符串,而将这个空字符串显示出来就是一个空格,而想要删除空行只需要使用我们之前学习过的rstrip()函数。

为什么要提供文件路径

将类似于 .txt 的简单文件名传递给函数 open()时,Python 将在当前执行的文件(即物程序文件)所在的目录中查找。

根据你组织文件的方式,有时可能要打开不在程序文件所属目录中的文件。例如,你可能将程序文件存储在了文件夹 python_work中,而该文件夹中有一个名为 text_files 的文件夹用于存储程序文件操作的文本文件。虽然文件夹 text_files 包含在文件夹python_work 中,但仅向 open()传递位于前者中的文件名称也不可行,因为 Python 只在文件夹 python_work中查找,而不会在其子文件夹 text_files 中查找。要让 Python 打开不与程序文件位于同一个目录中的文件,需要提供文件路径,让Python 到系统的特定位置去查找。

否则会出现如下图所示:python会告诉你找不到该文件

那么该怎么解决这个问题呢?

这里我们就需要用绝对路径,例如,我们现在建立一个.txt在桌面。

下面我们使用相对路径(仅提供文件名的方式),去打开:

with open(r"新建文本文档.txt",'r',encoding='utf-8') as f:
    ff=f.read()
print(ff)

我们发现文件根本打不开。

现在我们使用绝对路径(提供具体的位置信息),去打开:

with open(r"C:\Users\Lenovo\Desktop\新建文本文档.txt",'r',encoding='utf-8') as f:
    ff=f.read()
print(ff)

文件内容被很好的显示出来了。

注:encoding='utf-8的作用是为了避免出现乱码。

上图所示程序,不加encoding='utf-8,就会出现以下情况;

注:显示文件路径时,Windows系统使用反斜杠(\),而不是斜杠(/),但在代码中仍可以使用斜杠。

如果在文件路径中直接使用反斜杠,将引发错误,因为反斜杠用于对字符串中的字符进行转义。

举例:

C:\path\to\file.txt

其中的\t会被解读为制表符,如果一定要使用反斜杠,可对相对路径中的每个反斜杠都进行转义:

C:\\path\\to\\file.txt

逐行读取

读取文件时,常常需要检查其中的每一行:可能要在文件中查找特定的信息,或者要以某种方式修改文件中的文本。

直接使用for循环的方法:

在该目录下的文件读取:

for line in open("123.txt",encoding='utf-8'):
    print(line)

计算机其他位置中的:

for line in open(r"C:\Users\Lenovo\Desktop\新建文本文档.txt",encoding='utf-8'):
    print(line)

使用while循环

在该目录下的文件读取:

f=open("123.txt",encoding='utf-8')
line=f.readline()
while line:
    print(line)
    line=f.readline()
f.close()

计算机其他位置中的:

f=open(r"C:\Users\Lenovo\Desktop\新建文本文档.txt",encoding='utf-8')
line=f.readline()
while line:
    print(line)
    line=f.readline()
f.close()

使用with…as结构

在该目录下的文件读取:

with open("123.txt",encoding='utf-8') as f:
    for line  in f:
        print(line)

计算机其他位置中的:

with open(r"C:\Users\Lenovo\Desktop\新建文本文档.txt",encoding='utf-8') as f:
    for line in f:
        print(line)

运行上面两个文件的结果:

hi,python

早上好

晚上好

你好

窗前明月光,疑似地上霜

举头望明月,低头思归乡

鹅鹅鹅,曲项向天歌

白毛浮绿水,红掌拨清波

我们不难发现,空白行变得更多了,原因是:在这个文件中,每行末尾都有一个看不见的换行符,而print函数在调用的时候也会产生一个换行符,因此每行末尾都会有两个换行符,一个来自文件,一个来自print函数的调用,要想消除这些换行符,可在调用print函数的时候,使用rstrip():

print(line.rstrip())

处理之后的结果:

窗前明月光,疑似地上霜
举头望明月,低头思归乡
鹅鹅鹅,曲项向天歌
白毛浮绿水,红掌拨清波

hi,python
早上好
晚上好
你好

创建一个包含文件各行内容的列表

使用关键字 with 时,open()返回的文件对象只在 with 代码块内可用。如果要在 with 代码块外访问文件的内容,可在 with 代码块内将文件的各行存储在一个列表中,并在 with 代码块外使用该列表:可以立即处理文件的各个部分,也可以推迟到程序后面再处理。

with open("123.txt",encoding='utf-8') as f:
    lines=f.readlines()#使用readlines()从文件中读取每一行,并将其存储在一个列表中
    //这样处理后,在with代码块外仍然可以使用变量lines
for line  in lines:
    print(line)

输出结果:

hi,python

早上好

晚上好

你好

使用文件中的内容

举例:

with open("123.txt",encoding='utf-8') as f:
    lines=f.readlines()
pi=str()#创建空的字符串用于存储文本内容
for line  in lines:
    pi+=line.rstrip()#将每行末尾的空行去掉
print(pi)
print(len(pi))#输出字符串的长度

1234562345671038417968539
25

注:读取文本文件的时候,python会自动将所有的文本文件解读成字符串,如果文本文件中的内容为数值,并且要作为数值使用,就必须使用int()函数,或者float()函数将其进行转化。

举例:

如果上述例子中的123.txt中的内容要作为数值使用,则程序应进行修改:

如下:

with open("123.txt",encoding='utf-8') as f:
    lines=f.readlines()
pi=int()#进行强制转化
#pi=float()
for line  in lines:
    pi+=int(line)
    #pi+=float(line)
print(pi)

1038418326562

包含千位以上的大型文件

前面我们所分析的都是包含几行的文本文件,现在假设我们有一个文件,其中包含精确到小数点后千位而不是30位的圆周率,也可创建一个字符串将他包含到里面,有的小伙伴想到这个问题会觉得很棘手,程序该怎么写呢?

其实,我们前面编撰好的程序就可以直接进行传递使用:

with open("123.txt",encoding='utf-8') as f:
    lines=f.readlines()
pi=str()#创建空的字符串用于存储文本内容
for line  in lines:
    pi+=line.rstrip()#将每行末尾的空行去掉
print(f"{pi[:52]}.....")#为了避免显示的内容不停的滚动,只打印前52位
print(len(pi))#输出字符串的长度

1234562345671038417968539168519635885951538287826636.....
1596

同理,对于万位,百万位等等更大的文件,我们的程序仍然可以使用。

圆周率中包含你的生日吗

with open("123.txt",encoding='utf-8') as f:
    lines=f.readlines()
pi=str()#创建空的字符串用于存储文本内容
for line  in lines:
    pi+=line.rstrip()#将每行末尾的空行去掉
you_birthday=str(input("请输入你的生日"))
if you_birthday in pi:
    print("yes")
else:
    print("NO")

请输入你的生日0904
yes

写入文件

1:写入空文件:

要将文本写入文件,你在调用open()时,需要提供另一个参数,告诉python,你要写入打开的文件.

举例:

with open("123.txt",'w',encoding='utf-8') as f:
    f.write("晚上好")

打开该文件:

#open(名称,操作模式 )#操作模式包括:w:写,r:读取 ,a:附加,r+:读写`

如果省略了操作模式,python自动以只读的方式打开,如果要写入的文件不存在,python的open()函数将自动创建它,以写入的模式(w)打开,如果该文件已存在,则python会自动清空之前的内容。

python只能将字符串写入文本文件文件,要是想将数据存储到文本文件中,需要先用str()将其转化为字符串格式。

写入多行:

函数write()不会在写入的文本末尾添加换行符,因此如果写入多行时没有指定换行符,文件看起来可能不是我们想要的那样:

举例:

with open("123.txt",'w',encoding='utf-8') as f:
    f.write("早上好---good morning")
    f.write("中午好---good afternoon")
    f.write("晚上好---good evening")

如下图所示,所有的内容都被显示在一行:

怎么解决这种问题呢?需要在方法调用write()中包含换行符:

with open("123.txt",'w',encoding='utf-8') as f:
    f.write("早上好---good morning\n")
    f.write("中午好---good afternoon\n")
    f.write("晚上好---good evening\n")

现在文本内容呈现在不同行中:

像显示到终端一样,还可以使用空格,制表符和空行来设置这些输出的格式。

附加到文件

如果要给文件添加内容而不是覆盖原来的内容,可以以附加模式打开文件,以附加模式打开文件时,python不会在返回文件对象前清空文件的内容,而是将写入文件的行添加到文件末尾,如果指定的文件不存在,python会为你创建一个空文件。

举例:

with open("123.txt",'a',encoding='utf-8') as f:#以附加模式打开
    f.write("hello,world")#将hello,world写入文件

原内容并没有被清空。

加载全部内容

相关教程
猜你喜欢
用户评论