Excel作为Office的数据处理软件,我们几乎每天都在使用。虽然好用,但在大量录入、处理数据的时候,效率未免有点低。因此,很多学了Python的同学,会利用Python的第三方库来批量操作Excel,提升效率。
Python有很多支持操作Excel的第三方库,今天推荐的5个库,看看它们是如何让Excel效率起飞的!
Xlwings
Xlwings是非常强大的处理Excel的库,无论是Windows还是Mac,Excel还是WPS,都可以使用。
它功能非常齐全,能十分方便地新建、打开、修改、保存Excel,可以和matplotlib、numpy以及pandas无缝连接,支持读写numpy、pandas数据类型,将matplotlib可视化图表导入到excel中。另外,还可以调用Excel文件中VBA写好的程序,也可以让VBA调用Python写的程序。
import xlwings as xw #导入库
app = xw.App(visible=True,add_book=False)
wb = app.books.add() #打开Excel程序
wb = xw.Book('example.xlsx') #打开已有工作簿
wb.save('example.xlsx') #保存工作簿
wb.close() #退出工作簿(可省略)
app.quit() #退出Excel
sht = wb.sheets[0] #引用工作表,括号内是第一个sheet名
rng = sht.range('a1')
#rng = sht['a1'] #引用单元格,第一行的第一列即a1
rng = sht.range('a1:a5') #引用区域
sht.range('a1').value = 'Hello' #单元格A1,写入字符串‘Hello’
sht.range('a1').value = [1,2,3,4] #默认按行插入:A1:D4分别写入1,2,3,4
sht.range('a2').options(transpose=True).value = [5,6,7,8] #按列插入
sht.range('a6').expand('table').value = [['a','b','c'],['d','e','f'],['g','h','i']] #多行输入
print(sht.range('a1:d4').value) #读取A1:D4
rng = sht.range('a1').expand('table')
nrows = rng.rows.count
a = sht.range(f'a1:a{nrows}').value #读取Excel第一列
ncols = rng.columns.count
fst_col = sht[0,:ncols].value #读取Excel第一行
sht.range('A1').column #获取单元格列标
sht.range('A1').row #获取行标
sht.range('A1').column_width #获取列宽
sht.range('A1').row_height #获取行高
print(sht.range('A1').column ,sht.range('A1').row ,sht.range('A1').column_width ,sht.range('A1').row_height )
sht.range('A1').rows.autofit() #行高自适应
sht.range('A1').columns.autofit()#列宽自适应
sht.range('A1').color=(34,156,65) #给单元格A1上背景色
sht.range('A1').color #返回单元格颜色的RGB值
print(sht.range('A1').color)
sht.range('A1').color = None #清楚单元格颜色
print(sht.range('A1').color)
sht.range('A1').formula='=SUM(B6:B7)' #输入公式,相应单元格执行结果
sht.range('A1').formula_array #获取单元格公式
sht.range('A1').value=[['a1','a2','a3'],[1,2,3]] #向指定单元格位置写入批量信息
sht.range('A1').expand().value #使用expand()方法读取表中批量数据
print(sht.range('A1').expand().value)
import numpy as np
np_data = np.array((1,2,3))
sht.range('F1').value = np_data #写入numpy array数据类型
import pandas as pd
df = pd.DataFrame([[1,2], [3,4]], columns=['a', 'b'])
sht.range('A5').value = df #将pandas DataFrame数据类型写入excel
sht.range('A5').options(pd.DataFrame,expand='table').value #将数据读取,输出类型为DataFrame
import matplotlib.pyplot as plt
%matplotlib inline
fig = plt.figure()
plt.plot([1, 2, 3, 4, 5])
sht.pictures.add(fig, name='MyPlot', update=True) #将matplotlib图表写入到excel表格里
xlrd
xlrd主要是读取Excel,支持xlsx和xls格式的excel表格,可以实现指定表单、指定行列、指定单元格的读取。
import xlrd #导入库
data = xlrd.open_workbook(filename) #文件名以及路径,如果路径或者文件名有中文给前面加一个r拜师原生字符
# 获取book中一个工作表
table = data.sheets()[0] #通过索引顺序获取
table = data.sheet_by_index(sheet_indx)) #通过索引顺序获取
table = data.sheet_by_name(sheet_name) #通过名称获取
names = data.sheet_names() #返回book中所有工作表的名字
data.sheet_loaded(sheet_name or indx) # 检查某个sheet是否导入完毕
nrows = table.nrows #获取该sheet中的有效行数
table.row(rowx) #返回由该行中所有的单元格对象组成的列表
table.row_slice(rowx) #返回由该列中所有的单元格对象组成的列表
table.row_types(rowx, start_colx=0, end_colx=None) #返回由该行中所有单元格的数据类型组成的列表
table.row_values(rowx, start_colx=0, end_colx=None) #返回由该行中所有单元格的数据组成的列表
table.row_len(rowx) #返回该列的有效单元格长度
ncols = table.ncols #获取列表的有效列数
table.col(colx, start_rowx=0, end_rowx=None) #返回由该列中所有的单元格对象组成的列表
table.col_slice(colx, start_rowx=0, end_rowx=None) #返回由该列中所有的单元格对象组成的列表
table.col_types(colx, start_rowx=0, end_rowx=None) #返回由该列中所有单元格的数据类型组成的列表
table.col_values(colx, start_rowx=0, end_rowx=None) #返回由该列中所有单元格的数据组成的列表
table.cell(rowx,colx) #返回单元格对象
table.cell_type(rowx,colx) #返回单元格中的数据类型
table.cell_value(rowx,colx) #返回单元格中的数据
xlwt
xlwt主要是写入Excel,可以实现指定表单、指定单元格的写入,但保存的格式只支持xls格式。
import xlwt #导入模块
workbook = xlwt.Workbook(encoding='utf-8') #创建workbook 对象
worksheet = workbook.add_sheet('sheet1') #创建工作表sheet
worksheet.write(0, 0, 'hello') #往表中写内容,第一各参数 行,第二个参数列,第三个参数内容
workbook.save('students.xls') #保存表为students.xls
# 为内容设置style
workbook = xlwt.Workbook(encoding='utf-8')
worksheet = workbook.add_sheet('sheet1')
# 设置字体样式
font = xlwt.Font()
font.name = 'Time New Roman' # 字体
font.bold = True # 加粗
font.underline = True # 下划线
font.italic = True # 斜体
style = xlwt.XFStyle()
style.font = font # 创建style
worksheet.write(0, 1, 'world', style)
workbook.save('students.xls') # 根据样式创建workbook
# 合并单元格
workbook = xlwt.Workbook(encoding='utf-8')
worksheet = workbook.add_sheet('sheet1')
# 通过worksheet调用merge()创建合并单元格
# 第一个和第二个参数单表行合并,第三个和第四个参数列合并,
# 合并第0列到第2列的单元格
worksheet.write_merge(0, 0, 0, 2, 'first merge')
# 合并第1行第2行第一列的单元格
worksheet.write_merge(0, 1, 0, 0, 'first merge')
workbook.save('students.xls')
# 设置单元格的对齐方式
workbook = xlwt.Workbook(encoding='utf-8')
worksheet = workbook.add_sheet('sheet1')
alignment = xlwt.Alignment()
alignment.horz = xlwt.Alignment.HORZ_CENTER # 水平居中
alignment.vert = xlwt.Alignment.VERT_CENTER # 垂直居中
style = xlwt.XFStyle()
style.alignment = alignment
worksheet.col(0).width = 6666 # 设置单元格宽度
worksheet.row(0).height_mismatch = True
worksheet.row(0).height = 1000 # 设置单元格的高度
worksheet.write(0, 0, 'hello world', style)
workbook.save('center.xls')
# 设置单元格边框
workbook = xlwt.Workbook(encoding='utf-8')
worksheet = workbook.add_sheet('sheet1')
border = xlwt.Borders()
# DASHED虚线
# NO_LINE没有
# THIN实线
border.left = xlwt.Borders.THIN
border.right = xlwt.Borders.THIN
border.top = xlwt.Borders.THIN
border.bottom = xlwt.Borders.THIN
style = xlwt.XFStyle()
style.borders = border
worksheet.write(1, 1, 'love', style)
workbook.save('dashed.xls')
# 设置单元格背景色
workbook = xlwt.Workbook(encoding='utf-8')
worksheet = workbook.add_sheet('sheet1')
pattern = xlwt.Pattern()
pattern.pattern = xlwt.Pattern.SOLID_PATTERN
pattern.pattern_fore_colour = 3
style = xlwt.XFStyle()
style.pattern = pattern
worksheet.write(1, 1, 'shit', style)
workbook.save('shit.xls')
# 设置字体颜色
workbook = xlwt.Workbook(encoding='utf-8')
worksheet = workbook.add_sheet('sheet1')
font = xlwt.Font()
# 设置字体为红色
font.colour_index=xlwt.Style.colour_map['red']
style = xlwt.XFStyle()
style.font = font
worksheet.write(0, 1, 'world', style)
workbook.save('students.xls')
XlsxWriter
XlsxWriter可以用来写文本、数字、公式并支持单元格格式化、图片、图表、文档配置、自动过滤等特性,不过缺点也很明显,不能用来读取和修改Excel文件。
import xlsxwriter # 导入库
work_book = xlsxwriter.Workbook('my first.xlsx') # 创建一个excel文件,文件名为"my first.xlsx"
work_sheet1 = work_book.add_worksheet() # 添加shhet1
work_sheet2 = work_book.add_worksheet('my excel.xlsx') # 添加sheet名字为my excel.xlsx
work_sheet3 = work_book.add_worksheet() # 不加参数,默认添加sheet3
# write_number:写入数字
# write_blank:写入空格
# write_formula:写入公式
# write_datetime:写入时间格式
# write_boolean:写入逻辑数据
# write_url:写入链接地址
work_sheet2.write_string(0, 0, 'this is write string!')
work_sheet2.write_number('A2', 123456)
work_sheet2.write_blank('A3', None)
work_sheet2.write_number('B1', 12)
work_sheet2.write_number('B2', 24)
work_sheet2.write_number('B3', 35)
work_sheet2.write_formula('B7', '=sum(b1:b5)')
work_sheet2.write_datetime(0, 3, datetime.datetime.strptime('2019-04-18', '%Y-%m-%d'),
work_book.add_format({'num_format': 'yyyy-mm-dd'}))
work_sheet1.write_boolean(0, 0, True)
work_sheet1.write_url('A2', 'http://www.toutiao.com')
openpyxl
openpyxl 是比较火的操作excel表格的Python库,只支持03版本之后的 xlsx。
# 创建工作簿 Workbook
from openpyxl import Workbook
workbook = Workbook() # 创建一个工作簿对象
workbook.save('test.xlsx') # 保存这个工作簿,命名为test
# 打开已有工作簿
from openpyxl import load_workbook
workbook = load_workbook('test.xlsx') # #打开当前路径下的test表格
# 创建表
# 方法1:插入到最后(default)
ws1 = wb.create_sheet("Mysheet")
# 方法2:插入到最开始的位置
ws2 = wb.create_sheet("Mysheet", 0)
# 选择现有的表
from openpyxl import load_workbook
workbook = load_workbook('test.xlsx') # 打开当前路径下的test表格
sheet = workbook['first_sheet'] # 选择名字为first_sheet的表格页
# 删除表
from openpyxl import load_workbook
workbook = load_workbook('test.xlsx') # 打开当前路径下的test表格
sheet = workbook['first_sheet'] # 选择名字为first_sheet的表格页
workbook.remove(sheet) #删除这张表
# 访问单元格
# 方法1
cell1 = sheet['A1']
# 方法2
cell2 = sheet.cell(row=1,column=2)
cell1.value = '123456' # 设置单元格的值
sheet.merge_cells('A1:A2') #合并A1和A2单元格
今天就暂时先推荐到这里,有需要的同学赶紧收藏起来~~
原文地址:https://www.toutiao.com/a6931255525271175684/