Python利器openpyxl之操作excel表格_Python

python处理数据时，可以将数据保存至excel文件中，此处安利一个python利器，openpyxl，可以自动化处理数据值excel表格中。

1、安装

pip install openpyxl

2、使用

在使用前，需理清excel的几个概念

workbook：工作薄，即一个excel文件
worksheet：工作表，一个excel文件包含多个sheet，即包含多个工作表
colunm：列，excel中一竖列
row：行，excel中一横行
cell：单元格，组成工作表的最小单位

2.1 workbook对象

创建工作薄

				?

									from openpyxl import workbook

									# 创建一个工作簿

									w=workbook()

									# 获取当前工作sheet

									w_s=w.active

									# 指定sheet的标题

									w_s.title="demo1"

									# 创建一个工作表，index指定创建的工作表的位置，默认在最后面，title指定工作表的名称

									w_s=w.create_sheet(index=0, title="demo2")

									# 指定sheet按钮的颜色

									w_s.sheet_properties.tabcolor="ffa500"

									# 保存文件

									w.save('data/demo.xlsx')

其中当创建一个一个工作簿时，会默认创建一个名字为sheet的工作表。以下即上面代码所创建的excel工作簿（即excel文件）

Python利器openpyxl之操作excel表格

加载工作簿

				?

									from openpyxl import load_workbook

									# 打开一个工作簿,

									w=load_workbook("data/demo.xlsx")

									# 获取工作簿下所有工作表的名称,以下两种用法作用一样，官方推荐第一种第一种用法

									sheet_names1=w.sheetnames

									# sheet_names2=w.get_sheet_names()

									# 指定当前工作表,以下两种用法作用一样，官方推荐第一种第一种用法

									w_s1=w["demo1"]

									# w_s2=w.get_sheet_by_name("demo2")

									# 删除一个工作表

									w.remove(w["demo2"])

									sheet_names2=w.sheetnames

									# 保存文件

									w.save('data/demo.xlsx')

									print(sheet_names1)

									print(sheet_names2)

									>>>输出结果

									['demo2', 'demo1']

									['demo1']

2.2 worksheet对象

常用属性

title：表格的标题
dimensions：表格的大小，这里的大小是指含有数据的表格的大小，即：左上角的坐标:右下角的坐标，
max_row：表格的最大行
min_row：表格的最小行
max_column：表格的最大列
min_column：表格的最小列
rows：按行获取单元格(cell对象) - 生成器
columns：按列获取单元格(cell对象) - 生成器
freeze_panes：冻结窗格，冻结单元格上边所有行和左边所有列，但单元格所在行列不冻结，在果冻页面时，冻结的行和列始终保持不动
values：按行获取表格的内容(数据) - 生成器

常用方法

iter_rows：按行获取所有单元格，内置属性有(min_row,max_row,min_col,max_col)
iter_cols：按列获取所有的单元格
append：在表格末尾添加数据,参数为一列表或者元祖
merge_cells：合并多个单元格
unmerge_cells：移除合并的单元格

现在有这样一个excel表格:

				?

									from openpyxl import load_workbook

									w=load_workbook("data/猫眼电影.xlsx")

									w_s=w[w.sheetnames[0]]                          # 选择第一个工作表

									print("工作表标题：",w_s.title)

									print("工作表最大行数：",w_s.max_row)

									print("工作表最小行数：",w_s.min_row)

									print("工作表的大小（左上角到右下角的坐标）：",w_s.dimensions)

									print("工作表最大列数：",w_s.max_column)

									print("工作表最小列数",w_s.min_column)

									w_s.freeze_panes="b2"                           # 冻结第一列和第一行，

									# w_s.freeze_panes = 'b1'                       # 冻结列a

									# w_s.freeze_panes = 'c1'                       # 冻结列a和b

									# w_s.freeze_panes = 'c2'                       # 冻结行1和列a和列b

									# w_s.freeze_panes = 'a1'                       # 无冻结

									# w_s.freeze_panes = none                       # 无冻结

									# w_s.freeze_panes = 'a2'                       # 设置第一行为冻结

									w.save("data/猫眼电影.xlsx")

									>>>输出结果

									工作表标题： 猫眼电影

									工作表最大行数： 101

									工作表最小行数： 1

									工作表的大小（左上角到右下角的坐标）： a1:e101

									工作表最大列数： 5

									工作表最小列数 1

				?

									from openpyxl import load_workbook

									w=load_workbook("data/猫眼电影.xlsx")

									w_s=w[w.sheetnames[0]]                  # 选择第一个工作表

									# 获取第一行所有cell，返回一个生成器

									rows=w_s.iter_rows(min_row=1,max_row=1,min_col=1)

									# 获取第一行的第一行到第五行的cell，返回一个生成器

									cols=w_s.iter_cols(min_col=1,max_col=1,min_row=1,max_row=5)

									for row in rows:

									    print(row)

									for col in cols:

									    print(col)

									# 写入一行数据

									w_s.append([1,2,3,4,5])

									# 合并单元格，a1至d1合并到a1

									w_s.merge_cells('a1:d1')

									# 拆分单元格,此处需要注意的是若先合并再拆分单元格，拆分后的单元格不再恢复拆分前的格式和数值

									w_s.unmerge_cells('a1:d1')

									w.save("data/猫眼电影.xlsx")

									>>>输出结果

									(<cell '猫眼电影'.a1>, <cell '猫眼电影'.b1>, <cell '猫眼电影'.c1>, <cell '猫眼电影'.d1>, <cell '猫眼电影'.e1>)

									(<cell '猫眼电影'.a1>, <cell '猫眼电影'.a2>, <cell '猫眼电影'.a3>, <cell '猫眼电影'.a4>, <cell '猫眼电影'.a5>)

如下图，合并再拆分，cell之前的格式和值时不再存在。

Python利器openpyxl之操作excel表格

2.3 cell对象

获取cell方法

1、通过坐标定位的方法

				?

									cell1=w_s["a"][:5]

									cell2=w_s["a5"]

2、通过iter_rows()迭代方法,指定行列范围

				?

									rows = w_s.iter_rows(min_col=1, max_col=w_s.max_column, min_row=1, >max_row=1)

									for row in rows:

									   for cell in row:

									       print(cell)

									print("+"*20)

									cols = w_s.iter_cols(min_row=1, max_row=5, min_col=1, max_col=1)

									for col in cols:

									   for cell in col:

									       print(cell)

									>>>输出结果

									<cell '猫眼电影'.a1>

									<cell '猫眼电影'.b1>

									<cell '猫眼电影'.c1>

									<cell '猫眼电影'.d1>

									<cell '猫眼电影'.e1>

									++++++++++++++++++++

									<cell '猫眼电影'.a1>

									<cell '猫眼电影'.a2>

									<cell '猫眼电影'.a3>

									<cell '猫眼电影'.a4>

									<cell '猫眼电影'.a5>

3、通过指定具体行列方法

				?

									cell3=w_s.cell(row=1,column=1)

4、迭代全部行或列

				?

									for row in w_s.rows:

									   for cell in row:

									      cell.value=none

									for column in w_s.columns:

									   for cell in column:

									       cell.value=none

5、迭cell赋值

cell.value="xxx"

2.4 样式设置

目前官方提供的styles提供的样式有以下几块：

font: 来设置文字的大小，颜色和下划线等

patternfill： 填充图案和渐变色

border： 单元格的边框

alignment： 单元格的对齐方式等

font：

				?

									from openpyxl.styles import font

									font = font(name='宋体',size = 11,bold=true,italic=true,strike=true,color='000000')

									cell.font = font

设置字体为“宋体”，大小为11，bold为加粗，italic为斜体，strike为删除线，颜色为黑色

patternfill：

				?

									from openpyxl.styles import patternfill

									fill = patternfill(fill_type = "solid", fgcolor="9aff9a")

									cell.fill = fill

fill_type指定填充类型，fgcolor指定填充颜色（必须为rgb值，rgb颜色对照表）。另外需注意的是，fill_type若没有特别指定>类型，则后续的参数都无效，平时所用也是solid（完全填充，无渐变）和none最多，官方提供的还有
[‘none', ‘solid'', ‘darkdown', ‘darkgray', ‘darkgrid', ‘darkhorizontal', ‘darktrellis', ‘darkup', ‘darkvertical', ‘gray0625', ‘gray125', ‘lightdown', ‘lightgray', ‘lightgrid', ‘lighthorizontal', ‘lighttrellis', ‘lightup', ‘lightvertical', 'mediumgray']

patternfill：

				?

									from openpyxl.styles import border,side

									border = border(left=side(border_style='thin', color='000000'),

									right=side(border_style='thin', color='000000'),

									top=side(border_style='thin', color='000000'),

									bottom=side(border_style='thin', color='000000'))

									cell.border = border

官方提供的样式还有：

[‘dashdot', ‘dashdotdot', ‘dashed', ‘dotted', ‘double', ‘hair', ‘medium', >‘mediumdashdot', ‘mediumdashdotdot', ‘mediumdashed', ‘slantdashdot', ‘thick', 'thin']

alignment：

				?

									from openpyxl.styles import alignment

									align = alignment(horizontal=‘left',vertical=‘center',wrap_text=true)

									cell.alignment = align

horizontal: 水平方向对齐方式，左对齐left，居中center和右对齐right，分散对齐distributed，跨列居中centercontinuous，两端对齐justify，填充fill，常规general

vertical：垂直方向对齐方式，居中center，靠上top，靠下bottom，两端对齐justify，分散对齐distributed

wrap_text:自动换行

3、案例

掌握以上就基本平时够用了，自己写了一个案例。

现在有这样一个txt文件，需要把它写进excel文件中

Python利器openpyxl之操作excel表格

代码如下：

				?

									from openpyxl import workbook

									import json

									from openpyxl.styles import font, patternfill, alignment, border, side

									# 定义表头的样式

									style_head = {

									    "border": border(left=side(style='medium', color='ff000000'), right=side(style='medium', color='ff000000'),

									                     top=side(style='medium', color='ff000000'), bottom=side(style='medium', color='ff000000')),

									    "fill": patternfill("solid", fgcolor="9aff9a"),

									    "font": font(color="1e90ff", bold=true),

									    "alignment": alignment(horizontal="center", vertical="center")

									}

									# 定义表内容样式

									style_content = {

									    "border": border(left=side(style='thin', color='ff000000'), right=side(style='thin', color='ff000000'),

									                     top=side(style='thin', color='ff000000'), bottom=side(style='thin', color='ff000000')),

									    "alignment": alignment(horizontal='left', vertical='center'),

									    "font": font(name="黑体")}

									def get_data():

									    with open("data/demo猫眼电影top100.txt", 'r', encoding='utf8') as f:

									        # 迭代读取文件的每一行

									        for line in f.readlines():

									            # 将读取到的内容转化为python对象

									            data = json.loads(line)

									            yield data

									def write_to_excel():

									    # 创建一个工作簿

									    w = workbook()

									    # 获取当前工作表

									    w_s = w.active

									    # 更改当前工作表名称

									    w_s.title = "猫眼电影"

									    # 设置行的高度

									    w_s.row_dimensions[1].height = 20

									    # 设置列的宽度

									    w_s.column_dimensions["b"].width = 15

									    w_s.column_dimensions["c"].width = 35

									    w_s.column_dimensions["d"].width = 24

									    # 写入表头信息

									    title = ["排名", "电影名", "链接", "上映时间", "评分"]

									    w_s.append(title)

									    # 迭代方式取出表头（第一行）每个cell，指定样式

									    for row in w_s.iter_rows(max_row=1, min_col=1):

									        for cell in row:

									            cell.border = style_head["border"]

									            cell.fill = style_head["fill"]

									            cell.font = style_head["font"]

									            cell.alignment = style_head["alignment"]

									    # 从txt文件中获取相关数据

									    datas = get_data()

									    for data in datas:

									        # 写入表内容

									        w_s.append(list(data.values()))

									    # 迭代方式取出表中每个cell，指定样式

									    for row in w_s.iter_rows(min_row=2, min_col=1):

									        for cell in row:

									            cell.border = style_content["border"]

									            cell.alignment = style_content["alignment"]

									            cell.font = style_content["font"]

									    # 保存excel文件

									    w.save("data/猫眼电影.xlsx")

									if __name__ == "__main__":

									    write_to_excel()