Python xlrd读取Excel数据
华仔仔coding 人气:01. 安装 xlrd 库
Python 读取 Excel 中的数据主要用到 xlrd 第三方库。xlrd 其实就是两个单词的简化拼接,我们可以把它拆开来看,xl 代表 excel, rd 代表 read, 合并起来就是 xlrd, 意思就是读 excel 的第三方库。
这种命名风格也正是我们推荐使用的,要做到 “顾名思义”,不要使用晦涩难懂,与所实现的功能毫无关联的名称。
OK, 废话不多说了,下面我们就着手安装 xlrd 库,pip 命令如下:
pip install xlrd==1.2.0 -i https://mirrors.aliyun.com/pypi/simple
值得注意的是,我在安装 xlrd 库的时候,指定了 xlrd 的版本,即 xlrd==1.2.0
, 这也是在实践中积累的经验哦,因为不指定版本总是会有各种状况,为了确保不出错,大家尽量按照我这样安装吧。否则,出错可别找我哦!
2. 使用 xlrd 库
2.1 打开 Excel 工作表对象
(咳咳,战术咳嗽!) 首先,我们先梳理一下思路,把概念搞清楚。什么概念呢?就是大家知道什么是工作簿,什么是工作表,什么是单元格吗?
平时我们说的 Excel 工作表文件,其实严格来说它是个工作簿。然后打开工作簿,里面有多个 Sheet, 我们把这个称作 ”工作表“。之后,我们的数据是放在单元格里面的。
下面,让我们再用图片的形式展示,一起要分清概念。
工作簿:
工作表:
单元格:
好的,那么使用 xlrd 读取 Excel 表中的数据的时候也应按照:工作簿 -> 工作表 -> 单元格,这样的过程去读取数据的。
那么,打开工作对象的代码如下:
import xlrd # 打开工作簿 workbook = xlrd.open_workbook(r'C:\Users\Desktop\工作簿1.xlsx') # 三种方式获取工作表 # worksheet = workbook.sheet_by_index(0) # worksheet = workbook.sheets()[0] worksheet = workbook.sheet_by_name('Sheet1')
代码解析:
- 首先导入安装的第三方库 xlrd.
- 之后,使用 xlrd 库下的方法 open_workbook(), 打开一个工作簿,方法里的参数为工作簿的路径。
- 最后,根据拿到的工作簿对象,指定获取的工作表。当然了,获取工作表的方法有三种,分别是根据索引和根据工作表名称获取,索引是从0开始的。只要使用一种方式即可,这里我推荐使用根据工作表名称获取。
2.2 读取单个单元格数据
那么我们在上一小节打开了工作表对象之后,下面就要获取表里的单元格数据了呀!如何获取单元格数据呢?请看下面的代码:
import xlrd # 打开工作簿 workbook = xlrd.open_workbook(r'C:\Users\Desktop\工作簿1.xlsx') # 获取工作表 worksheet = workbook.sheet_by_name('Sheet1') # 获取单元格数据的两种方式 # cell_value = worksheet.cell(0, 0).value cell_value = worksheet.cell_value(0, 0) print(cell_value)
代码解析:
获取单元格数据的方法也很简单。这里提供了两种方法,都可以获取单元格数据,大家只要根据自己习惯,掌握一种即可。例如,我这里使用的是 cell_value() 方法,方法里传递的是单元格的索引。单元格的索引是二维的,第一个参数是所在行,第二个参数是所在列。需要注意的是,所有的索引都是从 0 开始计数的。
2.3 读取多个单元格数据
上一小节中,我们使用了 cell_value() 方法获取单个单元格数据,但是这种方式未免效率过于低下了,现在我们想一次性获取整行或者整列的数据,该如何去做呢 ?请看下面的代码:
import xlrd # 打开工作簿 workbook = xlrd.open_workbook(r'C:\Users\Desktop\工作簿1.xlsx') # 获取工作表 worksheet = workbook.sheet_by_name('Sheet1') # 获取第一行所有单元格数据 row_value = workbookt.row(0) # 获取第一列所有单元格数据 col_value = workbook.col(0)
代码解析:
与 2.2 小节不同的是,我们通过调用方法 row() 和 col() 分别获取某行和某列所有单元格数据,row() 和 col() 内传入的参数为索引,索引从 0 开始计数。例如,row(0) 表示获取第一行所有单元格数据,row(1) 表示获取第二行所有单元格数据。
那么我们运行上面的代码段,运行结果如下所示:
[text:'班级', text:'学号', text:'姓名', text:'成绩'] # row(0) 的结果值
[text:'班级'] # col(0) 的结果值
通过观察运行结果,我们发现运行的结果都是以列表的形式展示的。值得注意的是,列表的数值并不是字典格式,尽管这和 Python 中字典格式完全一样,实际上列表中元素的类型应该是 <class 'xlrd.sheet.Cell'>
, 这是 xlrd 中的 cell 对象,即单元格对象。单元格对象有 value 属性,因此我们可以通过遍历列表获得每一个 cell 对象,然后通过 value 属性取出每一个 cell 的值。
改造后的代码如下所示:
import xlrd # 打开工作簿 workbook = xlrd.open_workbook(r'C:\Users\Desktop\工作簿1.xlsx') # 获取工作表 worksheet = workbook.sheet_by_name('Sheet1') for i in worksheet.row(0): print(i.value) # 获取单元格数据 for i in worksheet.col(0): print(i.value) # 获取单元格数据
2.3 读取所有单元格数据
在上一小节中,我们学习了获取多个单元格数据,也就是整行或整列获取数据,这样获取数据的粒度更大,效率自然也更高。那么如果说,我想获取 Sheet 表中所有的数据又该怎么做呢?
要想获取 Sheet 表中所有单元格数据,就得知道 Sheet 表有多少行以及多少列。这样,我们根据行数和列数,才能获取 Sheet 表所有数据啊。xlrd 中 worksheet 对象有两个属性 nrows 和 ncols, 它们分别表示当前的 Sheet 表的行数和列数。
获取所有单元格数据的代码如下所示:
import xlrd # 打开工作簿 workbook = xlrd.open_workbook(r'C:\Users\Desktop\工作簿1.xlsx') # 获取工作表 worksheet = workbook.sheet_by_name('Sheet1') # 根据行获取所有单元格数据 for row in range(worksheet.nrows): for i in worksheet.row(row): print(i.value) # 根据列获取单元格数据 for col in range(worksheet.ncols): for i in worksheet.col(col): print(i.value)
代码解析:
上面的代码中,输出的结果应该都是所有单元格数据,只不过分别从行和列的角度出发获取单元格数据。其实,还可以用 cell_value() 方法结合 nrows 和 ncols 属性获取所有单元格数据,这种方法留给大家自己去尝试吧!
附:行、列操作
获取全行数据、切片、全行类型、行的有效单元格数等
# # 获取整行和整列的值(数组) k = 2 rows = sheet1_content1.row_values(k); # 获取第3行内容 row_values(rowx=2, start_colx=0, end_colx=None) cols = sheet1_content1.col_values(k); # 获取第3列内容 ### 行操作 对应列操作把 row 换成 col print(sheet1Name,'第',k+1,'行内容为',rows) print(sheet1_content1.row_slice(rowx=k))#返回由该行中所有的单元格对象类型及对象组成的列表 print(sheet1_content1.row_types(rowx=k, start_colx=0, end_colx=None))#返回由该行中所有的单元格对象类型及对象组成的列表 print(sheet1_content1.row(rowx=k))#返回由该行中所有的单元格对象类型及对象组成的列表 print(sheet1_content1.row_len(rowx=k)) #返回该行的有效单元格长度 # # 5. 获取单元格内容(三种方式) print(sheet1_content1.cell(0, 1).value) print(sheet1_content1.cell_value(0, 1)) print(sheet1_content1.row(0)[1].value) # print(sheet1_content1.row(10)[10].value) ## 超出索引长度会报错
3. 总结
通过上面的学习,相信大家对 xlrd 第三方库的安装以及使用第三方库读取 Excel 中的数据的方法有了一定的掌握。学习了读取操作之后,可以通过下一篇博客《使用 Python 第三方库 xlwt 写入数据到 Excel 工作表》学习向 Excel 工作表写入数据。
加载全部内容