一、xlrd和xlwt
使用之前需要先安装,windows上如果直接在cmd中运行python则需要先执行pip3 install xlrd和pip3 install xlwt,如果使用pycharm则需要在项目的解释器中安装这两个模块,File-Settings-Project:layout-Project Interpreter,点击右侧界面的+号,然后搜索xlrd和xlwt,然后点击Install Package进行安装。
对于excel来说,整个excel文件称为工作簿,工作簿中的每个页称为工作表,工作表又由单元格组成。
对于xlrd和xlwt,行数和列数从0开始,单元格的行和列也从0开始,例如sheet.row_values(2)表示第三行的内容,sheet.cell(1,2).value表示第二行第三列单元格的内容。
1.xlrd模块读取excel文件
使用xlrd模块之前需要先导入import xlrd,xlrd模块既可读取xls文件也可读取xlsx文件。
获取工作簿对象 :book = xlrd.open_workbook('excel文件名称')
获取所有工作表名称 :names = book.sheet_names(),结果为列表
根据索引获取工作表对象 :sheet = book.sheet_by_index(i)
根据名称获取工作表对象 :sheet = book.sheet_by_name('工作表名称')
获取工作表行数 :rows = sheet.nrows
获取工作表列数 :cols = sheet.ncols
获取工作表某一行的内容 :row = sheet.row_values(i) ,结果为列表 【sheet.row(i),列表】
获取工作表某一列的内容 :col = sheet.col_values(i) 结果为列表 【sheet.col(i),列表】
获取工作表某一单元格的内容 :cell = sheet.cell_value(m,n)、 sheet.cell(m,n).value、sheet.row(m)[n].value,sheet.col(n)[m].value,结果为字符串或数值 【sheet.cell(0,0),xlrd.sheet.Cell对象】
示例:假设在py执行文件同层目录下有一fruit.xls文件,有三个sheet页Sheet1、Sheet2、Sheet3,其中Sheet1内容如下:
import xlrd
book = xlrd.open_workbook('fruit.xls')print('sheet页名称:',book.sheet_names())
sheet = book.sheet_by_index(0)
rows = sheet.nrows
cols = sheet.ncolsprint('该工作表有%d行,%d列.'%(rows,cols))print('第三行内容为:',sheet.row_values(2))print('第二列内容为%s,数据类型为%s.'%(sheet.col_values(1),type(sheet.col_values(1))))print('第二列内容为%s,数据类型为%s.'%(sheet.col(1),type(sheet.col(1))))print('第二行第二列的单元格内容为:',sheet.cell_value(1,1))print('第三行第二列的单元格内容为:',sheet.cell(2,1).value)print('第五行第三列的单元格内容为:',sheet.row(4)[2].value)print('第五行第三列的单元格内容为%s,数据类型为%s'%(sheet.col(2)[4].value,type(sheet.col(2)[4].value)))print('第五行第三列的单元格内容为%s,数据类型为%s'%(sheet.col(2)[4],type(sheet.col(2)[4])))# 执行结果# sheet页名称: ['Sheet1', 'Sheet2', 'Sheet3']# 该工作表有5行,3列.# 第三行内容为: ['梨', 3.5, 130.0]# 第二列内容为['单价/元', 8.0, 3.5, 4.5, 3.8],数据类型为<class 'list'>.# 第二列内容为[text:'单价/元', number:8.0, number:3.5, number:4.5, number:3.8],数据类型为<class 'list'>.# 第二行第二列的单元格内容为: 8.0# 第三行第二列的单元格内容为: 3.5# 第五行第三列的单元格内容为: 300.0# 第五行第三列的单元格内容为300.0,数据类型为<class 'float'># 第五行第三列的单元格内容为number:300.0,数据类型为<class 'xlrd.sheet.Cell'>
可以看出通过sheet.row(i)、sheet.col(i)也可获取行或列的内容,并且结果也是一个列表,但是列表中的每一项类似字典的键值对,形式为数据类型:值。
而sheet.cell(0,0)获取单元格内容,结果是一个键值对,并且是一个xlrd.sheet.Cell对象。
2.xlwt写入excel文件
使用xlwt模块之前需要先导入import xlwt,xlwt模块只能写xls文件,不能写xlsx文件(写xlsx程序不会报错,但最后文件无法直接打开,会报错)。
创建工作簿 :book = xlwt.Workbook(),如果写入中文为乱码,可添加参数encoding = 'utf-8'
创建工作表 :sheet = book.add_sheet('Sheet1')
向单元格写入内容 :sheet.write(m,n,'内容1')、sheet.write(x,y,'内容2')
保存工作簿 :book.save('excel文件名称'),默认保存在py文件相同路径下,如果该路径下有相同文件,会被新创建的文件覆盖,即xlwt不能修改文件。
import xlwt
book = xlwt.Workbook()
sheet = book.add_sheet('Sheet1')
sheet.write(0,0,'hello')
sheet.write(1,0,'你好')
book.save('hello.xls')
逐个单元格写入excel比较麻烦,可以按行或者列写入。
import xlwt
proj = ['名称','单价/元','库存/kg']
fruit = ['苹果','梨','香蕉','橘子']
price = [8,3.5,4.5,3.8]
storage = [150,130,100,300]
book = xlwt.Workbook()
sheet = book.add_sheet('Sheet1')foriin range(0,len(proj)):
sheet.write(0,i,proj[i]) #按行插入行标题foriin range(0,len(fruit)):
sheet.write(i+1,0,fruit[i])#插入第一列水果名称foriin range(0,len(price)):
sheet.write(i+1,1,price[i])#插入第二列单价foriin range(0,len(storage)):
sheet.write(i+1,2,storage[i])#插入第三列库存book.save('fruit2.xls')
二、openpyxl模块
openpyxl模块可实现对excel文件的读、写和修改,只能处理xlsx文件,不能处理xls文件,使用之前同样需要先安装该模块,再导入 import openpyxl。
对于openpyxl,行数和列数都从1开始,单元格的行和列也从1开始。例如sheet.cell(1,2).value表示第一行第二列单元格的内容
1.openpyxl读取excel文件
获取工作簿对象:book = openpyxl.load_workbook('excel文件名称')
获取所有工作表名称:names = book.sheetnames
获取工作表对象:sheet1 = book.worksheets[n]、sheet2 = book['工作表名称']、sheet3 = book[book.sheetnames[n]]
获取工作表名称:title = sheet1.title
获取工作表行数:rows = sheet1.max_row
获取工作表列数:cols = sheet1.max_column
获取某一单元格内容:cell = sheet.cell(1,2).value、sheet['单元格'].value例如sheet['B1'].value
假设有一fruit2.xlsx,除后缀名其他与上述fruit.xls完全一样
import openpyxl
book = openpyxl.load_workbook('fruit2.xlsx')print('所有sheet页名称:',book.sheetnames)
sheet = book.worksheets[0]
sheet2 = book['Sheet1']
sheet3 = book[book.sheetnames[0]]print('工作表名称:',sheet3.title)
rows = sheet.max_row
cols = sheet.max_columnprint('该工作表有%d行,%d列.'%(rows,cols))# 执行结果# 所有sheet页名称: ['Sheet1', 'Sheet2', 'Sheet3']# 工作表名称: Sheet1# 该工作表有5行,3列.
2.行和列生成器
对于xlrd模块来说,可直接通过sheet.row[i]和sheet.col[i]获取行和列的内容,但是对于openpyxl模块来说,无法直接获取某一行或列的内容,openpyxl模块的sheet.rows和sheet.columns表示行和列的生成器,即generator object,需要通过循环或转换成列表、元组的形式得到行或列的值。
print(sheet.rows,sheet.columns)forcolin sheet.columns:
print(col)forrowin sheet.rows:
foriin row:
print(i.value,end='')
print()# 执行结果# <generator object Worksheet._cells_by_row at 0x00000230E011A2A0><generator object Worksheet._cells_by_col at 0x00000230E102FC00># (<Cell 'Sheet1'.A1>, <Cell 'Sheet1'.A2>, <Cell 'Sheet1'.A3>, <Cell 'Sheet1'.A4>, <Cell 'Sheet1'.A5>)# (<Cell 'Sheet1'.B1>, <Cell 'Sheet1'.B2>, <Cell 'Sheet1'.B3>, <Cell 'Sheet1'.B4>, <Cell 'Sheet1'.B5>)# (<Cell 'Sheet1'.C1>, <Cell 'Sheet1'.C2>, <Cell 'Sheet1'.C3>, <Cell 'Sheet1'.C4>, <Cell 'Sheet1'.C5>)# 名称 单价/元 库存/kg# 苹果 8 150# 梨 3.5 130# 香蕉 4.5 100# 橘子 3.8 300
如果要获取某一行或者列的内容,可将行、列生成器对象转换成列表或者元组,再循环列表或者元组得到内容。
前面说过openpyxl模块的行和列都从1开始,但是由于将生成器转化成了列表list(sheet.rows),而列表的索引从0开始,因此list(sheet.rows)[1]还是表示第二行的内容,不是第一行的内容。
foriinlist(sheet.rows)[1]:
print(i.value,end='')print()foriin list(sheet.columns)[0]:
print(i.value,end='')# 执行结果# 苹果 8 150# 名称 苹果 梨 香蕉 橘子
获取单元格的内容
print(sheet.cell(1,2).value)#第一行第二列单元格的内容print(sheet['a2'].value)#使用excel单元格的表示法,字母不区分大小写
3.openpyxl写excel文件
创建工作簿 :book = openpyxl.Workbook(),如果写入中文为乱码,可添加参数encoding = 'utf-8'
创建工作表: sheet = book.create_sheet('工作表名称',0),0表示创建的工作表在工作薄最前面
向单元格写入内容 :sheet.cell(m,n,'内容1')、sheet.cell(x,y,'内容2')
保存工作簿 :book.save('excel文件名称'),默认保存在py文件相同路径下,如果该路径下有相同文件,会被新创建的文件覆盖。
book = openpyxl.Workbook()
sheet = book.create_sheet('Sheet1',0)
proj = ['名称','单价/元','库存/kg']
fruit = ['苹果','香蕉','梨','橘子']
price = [8,3.5,4.5,3.8]
storage = [150,130,300,100]foriin range(len(proj)):
sheet.cell(1,i+1,proj[i])foriin range(len(fruit)):
sheet.cell(i+2,1,fruit[i])foriin range(len(price)):
sheet.cell(i+2,2,price[i])foriin range(len(storage)):
sheet.cell(i+2,3,storage[i])
book.save('fruit2.xlsx')
4.openpyxl修改excel文件
sheet.insert_rows(m)和sheet.insert_cols(n)分别表示在第m行、第n列前面插入行、列
sheet.delete_rows(m)和sheet.delete_cols(n)分别表示删除第m行、第n列
rows = sheet.max_row
sheet.insert_rows(rows+2)
cherry = ['樱桃',17,80] forjin cherry:
sheet.cell(rows+1,cherry.index(j)+1,j)
book.save('fruit2.xlsx')
修改单元格内容:sheet.cell(m,n) = '内容1'或者sheet['B3'] = '内容2'
sheet.cell(3,2,4)
sheet['B3'] = 5book.save('fruit2.xlsx')
在最后追加行:sheet.append(可迭代对象)
straberry = ['草莓',20,50]
sheet.append(straberry)
book.save('fruit2.xlsx')
三、xlsxwriter 模块
只能操作xlsx,只能写。在excel中插入图片
import matplotlib.pyplot as plt
2 import pandas as pd
3 import random
4 import xlsxwriter
5
6 ts = pd.Series(random.randrange(10))
7 fig = plt.figure()
8 ax = fig.add_subplot(1,1,1)
9 ts.plot(ax=ax)
10 fig.savefig('foo.png')
11
12 workbook = xlsxwriter.Workbook('pngxls.xlsx') # 创建excel文件
13 worksheet1 = workbook.add_worksheet('png') # 括号内为工作表表名
14 # 第一个参数是插入的起始单元格,第二个参数是图片你文件的绝对路径
15 worksheet1.write('A1','hello')
16 worksheet1.insert_image('B2','foo.png')
18 workbook.close()
xlrd、xlwt和openpyxl处理excel文件,在写入文件的时候不如pandas简单,pandas处理excel文件见另外一篇博客 https://www.cnblogs.com/Forever77/p/11298173.html
python 第一列 读取xlsx_Python新手上车25:Python操作读取Excel1 原创2021-01-09 16:00:30
weixin_39890543
码龄5年
关注
ab7f79acbc82f90e2db6ee5721f42ab7.png
我们经常谈到Python 在办公自动化方面的能力,用python来处理Excel表格更是其中典型的代表,这个阶段我们会提到xlrd 、xlwt 、openpyxl等处理Excel的利器。最后我们还会提到pandas ,使用padas 你会发现处理数据如此简单高效!
eb518697b01f6d5830ca52f0f499813a.png
xlrd安装
开始菜单-->输入CMD -->pip install xlrd=1.2.0
操作视频如下所示:
这里说明一下为什么要使用xlrd 1.2.0版本, 之前也遇到了这个坑,当你不指定版本时,默认给你安装最新版本xlrd2.0.1 ,但是使用后者读取.xlsx格式的文件时会出现以下报警:
xlrd.biffh.XLRDError: Excel xlsx file;not supported
2.0.1不支持xlsx格式文件,而目前我们使用的Excel2007以上版本生成的文件均是xlsx格式的,所以我们还是使用xlrd 1.2.0 来读取Excel. 当然未来我们还会讲到openpyxl,它不存在版本问题。
检查xlrd是否安装成功:
13c7fbca5f7498dbfb612f9f893fc10d.png
开始菜单-->输入CMD -->输入python-->输入 import xlrd
如果没有报警,那么说明xlrd安装成功
69137235f18f40213e28372e862d3b6a.png
使用xlrd打开Excel
在程序的同级目录下有一个person_data 的Excel,里面有如下数据:
person_data.xlsx:
57313628be8049b09be1c7c9f56b0a4b.png
import xlrdworkbook=xlrd.open_workbook("person_data.xlsx")sheet1=workbook.sheet_by_name("Sheet1")print(sheet1.cell(1,0).value)
第一行:我们导入xlrd库
第二行:我们使用xlrd.open_workbook(path),括号以内是路径名称
第三行:我们使用workbook的sheet_by_name方法并传入“Sheet1”,代表我们按照表格名进行索引,找到“Sheet1”这个表,并将其赋值给sheet1
第四行:我们打印sheet1中的cell(1,0)的值,python是按0开始索引的,所以结合之前的VBA知识,cell(1,0)是哪个单元格呢?
来看看执行结果:
ac6c64308dcb2c9e6b51e0634e9a4733.png
没错,cell(1,0)代表的就是第二行的第一列单元格,即“张一“ 这个名字。
e3e169b089abcc08056be022f89cabf0.png
遍历表格的列或行
事实上只取某个数值并不是我们想要的,有时候我们希望结合循环的方法,将一列或一行的数值取出,这样更有意义:
import xlrdworkbook=xlrd.open_workbook("person_data.xlsx")sheet1=workbook.sheet_by_name("Sheet1")for i in range(1,8):print(sheet1.cell(i,0).value)
第一行:我们导入xlrd库
第二行:我们使用xlrd.open_workbook(path),括号以内是路径名称
第三行:我们使用workbook的sheet_by_name方法并传入“Sheet1”,代表我们按照表格名进行索引,找到“Sheet1”这个表,并将其赋值给sheet1
第四行:我们遍历1-8范围,并把数值赋给i
第五行:我们打印第一列,第2至8行的数据,即姓名值
看看执行结果:
6529ae7788ad62a5dae46fd6d2f40384.png
这样我们就将表格中的数据获取出来了
dab01852cbcb5352cbf4d158dd216952.png
总行数和总列数
很多时候,我们希望表格中的行数是可变的,因为这样可以是记录变得可持续,但是带来的问题是,我们遍历的范围就需要是可变的,如何寻找这个可变的行数变量呢,我们可以使用总行数nrows 和总列数ncols 来计算目前的总列数和总行数:
以上excel为例,我们添加两行数据(红色字体部分):
person_data.xlsx:
82300f6f643082b27f8ddc1178ddbf15.png
现在我们来读取职位为工程师的人员的姓名:
import xlrdworkbook=xlrd.open_workbook("person_data.xlsx")sheet1=workbook.sheet_by_name("Sheet1")max_rows=sheet1.nrowsprint(sheet1.ncols)for i in range(1,max_rows):if sheet1.cell(i,2).value == "工程师":print("姓名:"+sheet1.cell(i,0).value +" 职位:"+sheet1.cell(i,2).value)
第一行:我们导入xlrd库
第二行:我们使用xlrd.open_workbook(path),括号以内是路径名称
第三行:我们使用workbook的sheet_by_name方法并传入“Sheet1”,代表我们按照表格名进行索引,找到“Sheet1”这个表,并将其赋值给sheet1
第四行:sheet1.nrows 代表sheet1的总行数,我们将总行数赋值给max_rows变量
第五行:打印sheet1的最大使用列数 ,即sheet1.ncols
第六行:遍历第2行至max_rows行
第七行:判断第i行第3列的值是否等于“”工程师“ ,如果是,则执行下面代码
第八行:打印姓名以及职位信息
看看执行结果:
a4af0341c5ac005bdf947761ba277786.png
现在即使我们再在person_data.xlsx里面增加数据(如下所示),也无需修改代码了:
0f6ed1fd8955b903f1813ea6bf28ff50.png
使用同样代码执行:
fbefb945b686615c64c5a54162060b6a.png
这样我们就可以让输入者动态输入,而我们的程序仍然可以正常运行。
9da1a8e34a48225da12483e3160fafdf.png
上期答案与本期习题
上期答案:
1.使用python创建一个write_test.txt ,并在里面写入一句话:life is short,I use python
with open('write_test.txt','w') as file_object:file_object.write('Life is short , I use python')
59248d239d2d52331b726b30b6d52559.png
本期习题:
1.创建一个test.xlsx的Excel ,在Excel内填写一行信息,使用python读取这一行信息,并将它打印出来。